开源 - 智狐AI导航

LangBot

LangBot 是一款开源的多平台即时通讯机器人，支持多种主流通信工具及大语言模型。具备多模态交互、多轮对话、插件扩展和安全管理等功能，适用于企业客服、个人助理、社区管理、教育辅导和内容创作等场景，提供灵活、安全的自动化服务。

AI项目与工具 2025年06月12日 18 点赞 0 评论 596 浏览

Skyvern

Skyvern是一款基于开源的浏览器自动化工具，集成了大型语言模型和计算机视觉技术，用于实现网页内容解析、交互计划生成及执行。其主要功能涵盖CAPTCHA解决、双因素认证支持、代理网络配置、可解释AI操作以及数据提取等，适用于网站数据抓取、表单填写、网页测试等多种应用场景。

AI项目与工具 2025年06月12日 90 点赞 0 评论 596 浏览

VideoSrt

VideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体（视频/音频）生成中/英文字幕、文本文件的业务场景。

Ai开源项目 2025年06月05日 31 点赞 0 评论 596 浏览

极客编辑器

极客编辑器是一款所见即所得富文本沉浸式写作排版编辑器，它注重高效创作，可多开文档编辑，同时支持Markdown语法输入及一键排版。

排版编辑 2025年06月05日 21 点赞 0 评论 595 浏览

书生·筑梦2.0（Vchitect 2.0）

书生·筑梦2.0是一款由上海人工智能实验室开发的开源视频生成大模型，支持文本到视频和图像到视频的转换，生成高质量的2K分辨率视频内容。它具备灵活的宽高比选择、强大的超分辨率处理能力以及创新的视频评测框架，适用于广告、教育、影视等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 594 浏览

Coze on WeChat

一个基于微信平台开发的智能助手，主要对接 Coze 平台，支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互，支持文本、语音等多种交互方式。

Ai开源项目 2025年06月05日 77 点赞 0 评论 593 浏览

MOFA

MOFA-Video是由腾讯AI实验室和东京大学研究人员开发的开源图像生成视频模型。该工具通过生成运动场适配器对图像进行动画处理，能够通过稀疏控制信号（如手动轨迹、面部关键点序列或音频）实现对视频生成过程中动作的精准控制。MOFA-Video支持零样本学习，能够将多种控制信号组合使用，生成复杂的动画效果，并能生成较长的视频片段。 ---

AI项目与工具 2025年06月12日 22 点赞 0 评论 593 浏览

Docling 是一款开源工具，支持多种文档格式的解析与转换，包括 PDF、DOCX、PPTX、图片和 HTML。它通过高级 PDF 理解和 OCR 技术，将文档内容转换为统一的结构化格式（如 Markdown 和 JSON）。Docling 可与 LlamaIndex 和 LangChain 集成，增强文档的检索和问答能力，并提供简洁的命令行界面，适用于自动化文档处理、数据科学、知识管理和信息检

AI项目与工具 2025年06月12日 41 点赞 0 评论 591 浏览

百聆

百聆是一款开源语音对话系统，融合语音识别、语音活动检测、大语言模型和语音合成技术，实现自然流畅的语音交互。支持低延迟运行，无需GPU，适用于边缘设备。具备记忆、工具调用和任务管理等功能，适用于智能家居、个人助理、车载系统等多种场景，提供高效的语音交互解决方案。

AI项目与工具 2025年06月12日 90 点赞 0 评论 591 浏览

Wan2.1

Wan2.1是阿里云推出的开源AI视频生成模型，支持文生视频与图生视频，具备复杂运动生成和物理模拟能力。采用因果3D VAE与视频Diffusion Transformer架构，性能卓越，尤其在Vbench评测中表现领先。提供专业版与极速版，适应不同场景需求，已开源并支持多种框架，便于开发与研究。

AI项目与工具 2025年06月12日 47 点赞 0 评论 590 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期