开源工具 - 智狐AI导航

Gemma 3

Gemma 3 是谷歌推出的开源人工智能模型，支持多语言、多模态处理，具备文本、图像及短视频分析能力。提供多种模型尺寸，适配不同硬件环境，优化了单 GPU/TPU 性能，推理速度提升显著。内置图像安全分类器，增强内容安全性。支持多种开发工具和部署方式，适用于人脸识别、物体检测、智能助手、文本分析等场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 546 浏览

Deforum

一款开源免费软件工具，一种基于Stable Diffusion的动画生成工具，它可以根据文本描述或参考视频生成连续的图像序列，并将它们拼接在一起以创建视频。

Ai视频生成 2025年06月05日 51 点赞 0 评论 544 浏览

olmOCR

olmOCR 是一款开源 PDF 文档处理工具，结合文档锚定技术和 Qwen2-VL-7B-Instruct 模型，可高效提取结构化文本并保留原始布局。支持多种文档类型，具备大规模批量处理能力和低成本优势，适用于学术研究、法律文件处理、企业文档管理及数字图书馆建设等多个场景。其开源特性与可扩展性也增强了用户的使用灵活性。

AI项目与工具 2025年06月12日 47 点赞 0 评论 542 浏览

Vision Parse

Vision Parse 是一款开源工具，旨在通过视觉语言模型将 PDF 文件转换为 Markdown 格式。它具备智能识别和提取 PDF 内容的能力，包括文本和表格，并能保持原有格式与结构。此外，Vision Parse 支持多种视觉语言模型，确保解析的高精度与高速度。其应用场景广泛，涵盖学术研究、法律文件处理、技术支持文档以及电子书制作等领域。

AI项目与工具 2025年06月12日 72 点赞 0 评论 542 浏览

Pake Plus

一个开源免费的应用打包工具，可将网页、Vue/React 项目编译后的 dist 文件、静态 html 文件快速打包为桌面应用和手机应用。

Ai编程建站 2025年06月05日 30 点赞 0 评论 539 浏览

Crawl4LLM

Crawl4LLM是由清华与CMU联合开发的智能爬虫系统，通过评估网页对大语言模型预训练的价值，提升数据获取效率。支持多种爬取模式，具备状态保存、数据可视化功能，并与DCLM框架兼容。采用多维度评分机制优化爬取策略，减少低价值内容抓取，降低对网站负担，适用于LLM预训练、数据集构建等场景。

AI项目与工具 2025年06月12日 55 点赞 0 评论 536 浏览

赤兔Chitu

Chitu（赤兔）是清华大学与清程极智联合开发的高性能大模型推理引擎，支持多种GPU及国产芯片，打破对特定硬件的依赖。其具备全场景部署能力，支持低延迟、高吞吐、小显存优化，并在性能上优于部分国外框架。适用于金融风控、智能客服、医疗诊断、交通优化和科研等领域，提供高效、稳定的推理解决方案。

AI项目与工具 2025年06月12日 25 点赞 0 评论 535 浏览

Yuxi

Yuxi-Know是一款基于RAG和知识图谱技术的智能问答平台，支持多种文档格式上传与向量化存储，可高效检索并生成准确答案。集成Neo4j知识图谱，支持复杂关系查询，兼容多模型平台及本地部署。提供智能体拓展、网页检索和可视化配置功能，适用于企业知识管理、教育、客服、医疗及科研等领域，提升信息处理效率与准确性。

AI项目与工具 2025年06月11日 78 点赞 0 评论 534 浏览

Gemma 3 QAT

Gemma 3 QAT 是谷歌推出的开源 AI 模型，采用量化感知训练技术，在降低显存需求的同时保持高性能。它支持多模态任务，具备 128,000-token 长上下文处理能力，并可在消费级 GPU 和边缘设备上运行。适用于视觉问答、文档分析、长文本生成等场景，同时兼容多种推理框架，便于部署。

AI项目与工具 2025年06月11日 44 点赞 0 评论 534 浏览

A2A

A2A是谷歌推出的首个智能体交互协议，旨在实现不同框架和供应商构建的AI智能体之间的高效协作。它支持多模态交互、长期任务管理和实时反馈，基于HTTP、JSON-RPC等标准设计，便于与现有系统集成。A2A具备安全性、可扩展性和用户体验协商能力，适用于企业流程自动化、跨平台客服、招聘优化、供应链协同和智能办公等多个场景。

AI项目与工具 2025年06月12日 59 点赞 0 评论 531 浏览

开源工具

首页

开源工具

列表

默认

浏览次数

发布日期