开源 - 智狐AI导航

Tesseract

Tesseract是一款开源的光学字符识别（OCR）引擎，支持多语言识别和多种图像格式。其具备高精度的文字识别能力，适用于文档数字化、表格数据提取、发票识别及移动OCR应用等多个场景。支持跨平台运行，并提供丰富的编程接口和自定义训练功能，便于开发者集成和优化识别效果。

AI项目与工具 2025年06月12日 12 点赞 0 评论 716 浏览

WebAgent

WebAgent是阿里巴巴开源的自主搜索AI Agent，具备端到端的自主信息检索与多步推理能力。它能主动搜索多个学术数据库，筛选、分析最相关的文献，整合不同文献中的观点，为用户提供全面且精准的研究报告。WebAgent基于创新的数据合成方法和高效的训练策略，实现高效的多步推理和信息检索能力，适用于学术研究、商业决策和日常生活等多种场景。

AI项目与工具 2025年06月11日 20 点赞 0 评论 716 浏览

Open Code Reasoning

Open Code Reasoning（OCR）是英伟达推出的开源代码推理AI模型，基于Nemotron架构设计，支持多种编程语言。它具备代码生成、逻辑补全、多语言处理及高效推理能力，适用于代码优化、教育、测试等多个场景。OCR提供32B、14B和7B三种参数版本，满足不同计算需求，并与主流框架兼容，具有良好的扩展性。

AI项目与工具 2025年06月11日 10 点赞 0 评论 717 浏览

kokoroTTS

一款开源、高性能的文本转语音（TTS）模型，Kokoro TTS拥有8200万参数，基于StyleTTS 2架构，提供高质量、自然的语音合成，适用于有声书、播客等。

Ai语音工具 2025年06月05日 80 点赞 0 评论 718 浏览

OOMOL

OOMOL（悟墨）是一款基于 VSCode 的现代化 IDE，专为工作流自动化设计。通过拖拽式界面，用户可快速构建复杂流程，无需编程基础。内置 Python 和 Node.js 环境，结合容器化技术实现跨平台一致性和数据安全。原生支持 AI 功能，涵盖数据科学、多媒体处理和模型开发等场景，适合开发者高效构建和共享工作流。

AI项目与工具 2025年06月12日 76 点赞 0 评论 719 浏览

Agent Squad

Agent Squad 是一个轻量级、开源的多 Agents 框架，用于协调多个 AI Agents 处理复杂对话。它支持 Python 和 TypeScript 两种语言，具备智能意图分类、灵活的 Agent 响应（流式与非流式）、上下文管理等功能，并提供模块化安装和可扩展架构。适用于智能客服、旅行规划、企业助手等场景，帮助开发者快速构建高效的多 Agents 系统。

AI项目与工具 2025年06月11日 32 点赞 0 评论 719 浏览

FunClip

FunClip是一款由阿里巴巴达摩院通义实验室开发的开源、本地部署的视频剪辑工具。它主要通过自动化语音识别技术，帮助用户基于语音转文字的结果，选择特定文本片段或说话人进行视频剪辑。其特点包括高精度的中文ASR模型、热词定制化、说话人识别功能、Gradio交互界面，以及支持多段剪辑和自动生成SRT字幕文件。

AI项目与工具 2024年07月01日 55 点赞 0 评论 719 浏览

VPP

VPP（Video Prediction Policy）是清华大学与星动纪元联合开发的AIGC机器人模型，基于视频扩散模型实现未来场景预测与动作生成。支持高频预测与跨机器人本体学习，显著降低对真实数据的依赖。在复杂任务中表现出色，适用于家庭、工业、医疗、教育等多个领域。其开源特性推动了具身智能机器人技术的发展。

AI项目与工具 2025年06月11日 61 点赞 0 评论 720 浏览

QrGPT

QrGPT是一款基于AI技术的二维码生成工具，支持用户通过输入链接或提示词自动生成个性化二维码。其主要功能包括快速生成二维码、个性化设计、开源代码以及一键部署。此外，QrGPT适用于多种场景，如营销推广、活动管理、个人名片及社交媒体链接分享等，助力用户高效实现信息传递。

AI项目与工具 2025年06月12日 51 点赞 0 评论 721 浏览

Refly Ai

一款基于自由画布构建的AI原生内容创作平台，通过多线程对话、知识库整合、上下文记忆、智能搜索和AI文档编辑器等功能，轻松将想法转化为优质内容。

AI写作对话 2025年06月05日 79 点赞 0 评论 721 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期