语音 - 智狐AI导航

MiniCPM

MiniCPM-o 2.6 是一款高性能的多模态大模型，具备 8B 参数量，支持视觉、语音及多模态直播等多种功能。其在图像处理、语音识别和实时交互方面表现优异，采用高效的 token 技术提升推理速度，可在端侧设备上运行。支持多种语言和音色配置，适用于智能助手、内容创作、教育、客服和医疗等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 744 浏览

KAPWING

KAPWING是一款基于AI技术的在线视频编辑平台，提供从视频生成到编辑的一站式解决方案。其核心功能涵盖AI视频生成器、文档转视频、文本转语音、字幕生成及高级编辑工具，支持用户轻松创建和定制视频内容。此外，KAPWING还具备团队协作能力，适合教育、企业宣传及内容创作等多个应用场景。

AI项目与工具 2025年06月12日 14 点赞 0 评论 743 浏览

EasyVideoTrans

EasyVideoTrans是一款开源的AI视频翻译工具，支持从视频中提取音频并翻译字幕，同时提供多样化的声音风格以实现自然的配音效果。它适用于视频创作者、教育机构、企业培训及品牌宣传等领域，能够快速生成高质量的中文版本视频，满足跨语言沟通的需求。

AI项目与工具 2025年06月12日 39 点赞 0 评论 743 浏览

SOLAMI

SOLAMI是一款基于VR环境的3D角色扮演AI系统，支持用户通过语音和肢体语言与虚拟角色进行沉浸式互动。系统采用社交视觉-语言-行为模型（Social VLA），可识别用户的多模态输入并生成相应响应，涵盖多种角色类型及互动场景，如游戏、舞蹈等。其核心技术涉及多任务预训练和指令微调，适用于虚拟社交、教育、心理治疗及娱乐等多个领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 743 浏览

FalcoCut

一款功能非常实用的多语言本地化AI视频生成与编辑工具，支持视频翻译、换脸、音频编辑、唇同步、数字人生成等功能。

Ai视频生成 2025年06月05日 95 点赞 0 评论 741 浏览

MoshiVis

MoshiVis是一款由Kyutai开发的开源多模态语音模型，支持图像与语音的自然交互。它基于Moshi 7B架构，集成了视觉编码器和跨注意力机制，实现低延迟、自然流畅的对话体验。支持多种后端部署，适用于无障碍应用、智能家居、教育及工业场景，提升人机交互的智能化水平。

AI项目与工具 2025年06月12日 72 点赞 0 评论 741 浏览

ChatPaper.ai

一个论文、视频、笔记的AI总结学习助手，轻松提炼论文精华、整理课堂重点、生成会议纪要。基于先进AI技术，支持多语言处理，为学生、研究者和职场人士量身打造。

Ai语音工具 2025年06月05日 44 点赞 0 评论 740 浏览

Vidnoz

Vidnoz是一款基于AI的在线视频生成工具，拥有超过1200个逼真的虚拟形象、470多种语言支持及900多个视频模板，支持从文本到视频的全流程制作。其主要功能包括AI虚拟形象生成、文字转语音、视频模板应用、智能编辑、语音克隆以及静态图片动态化处理，广泛应用于社交媒体营销、在线教育、企业培训、产品宣传等领域。

AI项目与工具 2025年06月12日 57 点赞 0 评论 740 浏览

ViiTor AI

ViiTor AI是一款基于人工智能技术的创新平台，集成了视频翻译、语音克隆、动态语音合成等功能，支持多语言处理。它能够将静态内容转化为动态形式，同时实现跨语言交流，适用于个人创作者、教育机构、跨国企业和翻译行业，帮助企业提升全球化竞争力。

AI项目与工具 2025年06月12日 86 点赞 0 评论 739 浏览

Voice

Voice-Pro是一款开源的多功能音频处理工具，集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等功能，支持超过100种语言，广泛应用于教育、娱乐和商业领域，显著提升音频处理效率和便捷性。

AI项目与工具 2025年06月12日 33 点赞 0 评论 739 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期