开源工具 - 智狐AI导航

Oliva

Oliva 是一款基于语音驱动的 RAG 助手，结合 Langchain 和 Qdrant 向量数据库，实现语音指令到结构化数据的实时响应。支持多智能体协作、语义搜索与灵活知识库集成，适用于企业知识库、智能客服、智能家居等多种场景。具备语音识别、实时通信和自然语言处理能力，提升信息获取与交互效率。

AI项目与工具 2025年06月12日 57 点赞 0 评论 861 浏览

Co

Co-op Translator是一款基于Azure AI服务的开源多语言翻译工具，支持Markdown文件及图像文本的自动化翻译。它采用先进的大型语言模型（LLM）技术，确保翻译质量的同时保持语义准确性和上下文连贯性。该工具可无缝集成到现有项目中，帮助简化本地化流程，适用于开源项目文档、软件开发、技术博客、教育材料以及企业内部文档等多种应用场景。

AI项目与工具 2025年06月12日 81 点赞 0 评论 854 浏览

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI项目与工具 2025年06月12日 97 点赞 0 评论 854 浏览

流畅阅读

FluentRead 是一款开源的浏览器翻译插件，基于AI技术提供精准、自然的翻译服务。支持多种翻译引擎和双语对照显示，具备隐私保护和高度定制化功能。适用于学术研究、工作场景、语言学习及日常阅读，兼容主流浏览器，保障用户数据安全。其开源特性增强了透明度与灵活性，满足多样化翻译需求。

AI项目与工具 2025年06月12日 68 点赞 0 评论 853 浏览

ChatTS

ChatTS-14B 是一款由字节跳动开发的大型语言模型，专为时间序列数据的理解与推理设计，具备 140 亿参数规模。通过合成数据对齐技术提升任务表现，支持自然语言交互，可应用于金融、气象、工业、医疗和运维等多个场景，提供数据分析、预测与诊断功能。模型已开源，便于开发者使用和扩展。

AI项目与工具 2025年06月11日 73 点赞 0 评论 852 浏览

TripoSR

TripoSR是一款由Stability AI与VAST联合开发的开源3D生成模型，能够在不到0.5秒内从单张2D图像生成高质量的3D模型。基于Transformer架构和大型重建模型（LRM）设计，采用先进的图像编码、三平面NeRF表示及优化训练策略，支持无GPU设备运行。适用于游戏开发、影视制作、建筑设计、产品设计等多个领域，具有高效、高精度和广泛适用性的特点。

AI项目与工具 2025年06月12日 80 点赞 0 评论 850 浏览

Whisper Input

Whisper Input 是一款开源语音输入工具，基于 Python 和 OpenAI Whisper 模型开发，支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本，具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 847 浏览

AgenticSeek

AgenticSeek是一款完全本地化的开源AI助手，作为Manus的开源替代品，它能够在本地设备上自主执行任务，如浏览网页、编写代码和规划项目，确保用户隐私。支持多种编程语言，具备智能任务拆解与执行能力，用户可通过语音或文本交互。适用于注重隐私和希望在本地环境中使用AI工具的用户。

AI项目与工具 2025年06月11日 21 点赞 0 评论 845 浏览

Heygem

Heygem是一款由硅基智能推出的开源数字人模型，支持Windows系统。它可通过1秒视频或照片快速生成数字人形象和声音，30秒内完成克隆，60秒合成4K视频。具备多语言支持、100%口型匹配、低配置运行等优势，适用于内容创作、教育、直播、影视及客服等多个领域，提供高效、低成本的数字人解决方案。

AI项目与工具 2025年06月12日 18 点赞 0 评论 845 浏览

FacePoke

FacePoke是一款基于AI的开源实时面部编辑工具，支持通过简单拖拽操作调整人物头部姿态和面部表情，使静态图像更加生动。其采用深度学习技术，具备高分辨率输出和精确控制能力，适用于数字艺术、内容创作及影视制作等领域。工具基于LivePortrait技术开发，支持本地和Docker部署，便于用户灵活使用。

AI项目与工具 2025年06月12日 86 点赞 0 评论 843 浏览

开源工具

首页

开源工具

列表

默认

浏览次数

发布日期