开源 - 智狐AI导航

OBS Studio

一款免费开源的视频录制及直播串流软件，用户可以通过OBS Studio创建包含多种视频源的场景，进行视频捕捉、合成、编码和录制，支持Windows、macOS、Linux和BSD等多个平台。

直播录屏 2025年06月05日 41 点赞 0 评论 692 浏览

SmolVLM是一款由Hugging Face开发的轻量级视觉语言模型，专为设备端推理设计。该模型具有三个版本，包括SmolVLM-Base、SmolVLM-Synthetic和SmolVLM-Instruct，分别适用于不同的应用场景。SmolVLM借鉴了Idefics3的理念，采用SmolLM2 1.7B作为语言主干，并通过像素混洗技术提升视觉信息的压缩效率。其训练数据集包括Cauldron和

AI项目与工具 2025年06月12日 62 点赞 0 评论 692 浏览

Umi

Umi-OCR 是一款离线 OCR 工具，支持图片、截图和 PDF 文档的文字识别，具备数学公式与二维码识别功能，可生成可搜索 PDF。支持多语言识别与界面切换，提供命令行和 HTTP 接口调用，适用于文档数字化、数据录入、教育等多个场景。

AI项目与工具 2025年06月12日 51 点赞 0 评论 691 浏览

CodeWhisperer

使用您的 AI 编码配套应用程序更快、更安全地构建应用程序，Amazon CodeWhisperer 是一款基于AI的代码生成器，可帮助您更快地编写更好的代码。

Ai编程建站 2025年06月05日 53 点赞 0 评论 690 浏览

Open Avatar Chat

Open Avatar Chat是阿里开源的模块化实时数字人对话系统，支持低延迟交互与多模态输入输出。系统采用模块化架构，允许灵活配置语音识别、语言模型和语音合成等组件，兼容本地与云服务。支持2D/3D数字人渲染，适用于客户服务、教育、娱乐及企业应用等多个场景，为开发者提供高效、灵活的AI对话解决方案。

AI项目与工具 2025年06月11日 81 点赞 0 评论 690 浏览

Yesicon

一个支持中文搜索的高品质、开源、免费的矢量图标库。利用 ChatGPT API将Iconify 的21万个图标名做翻译并扩展成中文的关键词，使用户能以中文搜索到想要的图标。

logo图标 2025年06月05日 65 点赞 0 评论 690 浏览

Aider

Aider 是一款开源 AI 编程辅助工具，支持多语言开发，集成多种大型语言模型，通过命令行实现代码编辑、自动提交和多文件处理。具备语音编程、图片交互等功能，提升开发效率。适用于新项目搭建、代码修复、重构及团队协作，支持与主流 IDE 集成，提供流畅的开发体验。

AI项目与工具 2025年06月12日 83 点赞 0 评论 689 浏览

AIMv2

AIMv2是苹果公司开发的开源多模态自回归预训练视觉模型，通过图像与文本的深度融合提升视觉理解能力。其采用图像块与子词标记拼接的方式进行自回归预训练，支持多种参数规模，适用于不同设备。具备视觉问答、指代表达理解、图像字幕生成、多媒体检索等功能，并可无缝集成到大型语言模型中。模型在多个视觉任务中表现优异，具备良好的可扩展性和零样本适应能力。

AI项目与工具 2025年06月12日 48 点赞 0 评论 689 浏览

Hibiki

Hibiki是一款由Kyutai Labs开发的开源语音翻译解码器，支持实时语音到语音（S2ST）和语音到文本（S2TT）的翻译。其基于多流语言模型架构，结合弱监督学习和上下文对齐技术，实现低延迟、高保真度的翻译效果。适用于国际会议、在线教育、旅游、新闻采访及客户服务等场景，具备良好的实用性和可扩展性。

AI项目与工具 2025年06月12日 31 点赞 0 评论 688 浏览

FastAPI

FastAPI-MCP 是一款将 FastAPI 端点自动转换为 MCP 协议的开源工具，支持零配置部署，保留原有接口结构和文档，具备灵活的部署方式和自定义命名功能。适用于企业自动化、AI 应用开发、数据分析等多个场景，提升 AI 与后端服务的交互效率。

AI项目与工具 2025年06月11日 92 点赞 0 评论 688 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期