开源 - 智狐AI导航

OpenR

OpenR是一个由多家知名高校联合开发的开源框架，专注于通过强化学习和搜索技术提升大型语言模型的推理能力。它集成了数据获取、强化学习训练及非自回归解码功能，支持多种搜索算法和在线强化学习训练，能够有效提高模型的推理效率和精度。同时，其自动化数据处理能力减少了人工标注的需求，适用于数学问题求解、代码生成、自然语言处理等多种应用场景。

AI项目与工具 2025年06月12日 40 点赞 0 评论 529 浏览

GTSinger

GTSinger是一项由浙江大学研发的开源高质量歌声数据集，包含80.59小时的多语言专业录音棚歌声数据，支持歌声合成、技巧识别、风格迁移和语音到歌声转换等多种任务。它通过音素级标注和真实乐谱支持，为歌唱技巧的研究和应用提供了强大工具。

AI项目与工具 2025年06月12日 77 点赞 0 评论 693 浏览

Surya

Surya是一款开源OCR工具包，专注于文档识别，支持90多种语言的文本提取与分析。它能够识别文档中的文本、表格、图片及标题等布局元素，并确保文本阅读顺序的准确性。凭借其高效的表格识别能力和优化的算法，Surya在处理复杂文档时表现出色，广泛应用于文档数字化、数据提取、多语言处理以及学术研究等领域。 ---

AI项目与工具 2025年06月12日 16 点赞 0 评论 783 浏览

Learn Prompting

Learn Prompting 是一个开源平台，致力于教授 AI 提示工程相关知识，涵盖从基础到高级的内容。其主要功能包括智能推荐、深度解析、模拟对话、学习进度跟踪等，同时提供体系化课程及实际应用场景案例。该工具适用于教育、语言学习、内容创作、数据分析等多个领域，助力用户提升 AI 技术的应用能力。

AI项目与工具 2025年06月12日 16 点赞 0 评论 870 浏览

Aria

Aria是首个开源多模态原生混合专家（MoE）模型，支持文本、代码、图像和视频的综合处理，具有强大的多模态任务处理能力和长上下文窗口，可高效应对复杂长数据。模型开源且可扩展，适用于多模态AI领域的研究与应用。

AI项目与工具 2025年06月12日 48 点赞 0 评论 596 浏览

LosslessCut

LosslessCut 是一款基于 FFmpeg 的开源视频编辑工具，支持无损剪辑、合并、格式转换及多轨道编辑等功能。它通过直接操作数据流避免重新编码，保持视频质量，适用于家庭用户、视频创作者及专业人士。该工具提供了高分辨率截图、智能剪辑及多种接口支持，能够高效处理各类视频文件。

AI项目与工具 2025年06月12日 15 点赞 0 评论 668 浏览

Gradio

Gradio 是一款开源 Python 工具，用于快速构建和共享机器学习模型的交互式网页界面。支持多类型输入输出组件，具备实时交互能力，并通过服务器端渲染优化性能。Gradio 5 引入性能提升、界面更新及安全性改进，支持实验性 AI Playground，广泛应用于模型演示、教育、原型开发及远程协作等领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 637 浏览

Podcastfy

Podcastfy 是一款基于生成式人工智能技术开发的开源工具，可将网络文章、PDF 文件及纯文本转化为多语言对话式音频。它不仅支持多源文本合并，还具备强大的文本转语音功能，允许用户选择不同的语音模型来优化音频效果。此外，其开源特性便于开发者根据需求进行个性化定制，广泛适用于内容摘要、语言本地化、教育材料转化等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 782 浏览

Stablecog

Stablecog 是一款基于人工智能技术的开源图像生成工具，能够根据文本描述或现有图片生成逼真的艺术作品。它支持多种艺术风格，具备图像编辑和调整功能，适用于艺术创作、设计、社交媒体内容制作等多个领域。

AI项目与工具 2025年06月12日 84 点赞 0 评论 514 浏览

Wren AI

Wren AI 是一个开源的文本到 SQL 工具，基于自然语言处理技术，允许用户通过自然语言提问来执行数据库查询，无需编写 SQL 代码。它支持多种数据库和数据源，具有语义理解能力，能准确解析业务上下文并提供精确的结果。Wren AI 的核心功能包括语义引擎、向量数据库和大型语言模型，支持数据集成、安全性和结果导出，广泛应用于业务智能分析、数据探索、报告生成等领域。

AI项目与工具 2025年06月12日 82 点赞 0 评论 565 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期