开源

首页

开源

列表

默认

浏览次数

发布日期

百聆

百聆是一款开源语音对话系统，融合语音识别、语音活动检测、大语言模型和语音合成技术，实现自然流畅的语音交互。支持低延迟运行，无需GPU，适用于边缘设备。具备记忆、工具调用和任务管理等功能，适用于智能家居、个人助理、车载系统等多种场景，提供高效的语音交互解决方案。

AI项目与工具 2025年06月12日 90 点赞 0 评论 591 浏览

Coze on WeChat

Coze on WeChat

一个基于微信平台开发的智能助手，主要对接 Coze 平台，支持大部分 Coze Bot 功能。它允许用户通过微信与 AI 聊天机器人进行交互，支持文本、语音等多种交互方式。

Ai开源项目 2025年06月05日 77 点赞 0 评论 593 浏览

MOFA

MOFA

MOFA-Video是由腾讯AI实验室和东京大学研究人员开发的开源图像生成视频模型。该工具通过生成运动场适配器对图像进行动画处理，能够通过稀疏控制信号（如手动轨迹、面部关键点序列或音频）实现对视频生成过程中动作的精准控制。MOFA-Video支持零样本学习，能够将多种控制信号组合使用，生成复杂的动画效果，并能生成较长的视频片段。 ---

AI项目与工具 2025年06月12日 22 点赞 0 评论 593 浏览

书生·筑梦2.0（Vchitect 2.0）

书生·筑梦2.0（Vchitect 2.0）

书生·筑梦2.0是一款由上海人工智能实验室开发的开源视频生成大模型，支持文本到视频和图像到视频的转换，生成高质量的2K分辨率视频内容。它具备灵活的宽高比选择、强大的超分辨率处理能力以及创新的视频评测框架，适用于广告、教育、影视等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 594 浏览

极客编辑器

极客编辑器

极客编辑器是一款所见即所得富文本沉浸式写作排版编辑器，它注重高效创作，可多开文档编辑，同时支持Markdown语法输入及一键排版。

排版编辑 2025年06月05日 21 点赞 0 评论 595 浏览

WordToCard

WordToCard

WordToCard

一个能将Word文档内容智能转化为精美知识卡片的图文制作开源免费工具，能将 Word 文档自动转换为结构清晰、美观大方的图文卡片。

排版编辑 2025年06月05日 79 点赞 0 评论 596 浏览

LangBot

LangBot

LangBot 是一款开源的多平台即时通讯机器人，支持多种主流通信工具及大语言模型。具备多模态交互、多轮对话、插件扩展和安全管理等功能，适用于企业客服、个人助理、社区管理、教育辅导和内容创作等场景，提供灵活、安全的自动化服务。

AI项目与工具 2025年06月12日 18 点赞 0 评论 596 浏览

Skyvern

Skyvern

Skyvern是一款基于开源的浏览器自动化工具，集成了大型语言模型和计算机视觉技术，用于实现网页内容解析、交互计划生成及执行。其主要功能涵盖CAPTCHA解决、双因素认证支持、代理网络配置、可解释AI操作以及数据提取等，适用于网站数据抓取、表单填写、网页测试等多种应用场景。

AI项目与工具 2025年06月12日 90 点赞 0 评论 596 浏览

VideoSrt

VideoSrt

VideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体（视频/音频）生成中/英文字幕、文本文件的业务场景。

Ai开源项目 2025年06月05日 31 点赞 0 评论 596 浏览

All GPTs

All GPTs

All GPTs目录是一个综合性在线资源，列出了各种GPT（预训练生成式转换器）模型、AI代理和应用程序。它是一个集中的地方，可以找到和探索基于AI的解决方案。

GPTs应用 2025年06月05日 76 点赞 0 评论 597 浏览

微信公众账号

微信扫一扫加关注