语音

MARS5

MARS5-TTS是一款开源的AI声音克隆工具,支持140多种语言的文本转语音功能。它能够生成高度逼真的语音,并处理复杂的韵律场景。该工具拥有12亿参数,基于超过15万小时的训练数据。用户可以通过文本中的标点符号和大小写等标记引导语音的韵律和情感,同时提供快速克隆和深度克隆两种模式。MARS5-TTS可应用于内容创作、语言学习、辅助技术、客户服务和多媒体娱乐等多种场景。

NEXUS

NEXUS-O是一款由多家知名机构联合开发的多模态AI模型,能够处理音频、图像、视频和文本等多种输入,并以相应形式输出结果。它在视觉理解、音频问答、语音识别和翻译等方面表现出色,具备强大的跨模态对齐与交互能力。模型基于视觉语言预训练,结合高质量音频数据提升性能,并通过多模态任务联合训练增强泛化能力。适用于智能语音助手、视频会议、教育、智能驾驶、医疗健康等多个领域。

Peech

Peech 是一个强大的文本转语音工具,能够轻松地将文本转换成超过50种语言的逼真AI生成音频。

Shadow

Shadow是一款智能会议助手,支持自动转录、语音识别、会议记录生成及关键信息提取等功能,帮助用户提升会议效率和执行力。其核心优势包括本地数据处理、隐私保护、与主流会议平台集成以及自动化任务执行能力。适用于销售、项目管理、市场分析及客户服务等多个场景,是提升团队协作效率的实用工具。

ToucanTTS

一套用于最先进语音合成的工具包,ToucanTTS覆盖超过7,000种语言的大型多语言模型。

Yoodli AI

Yoodli 是一款可让您录制您的演讲或演示文稿,并获得有关在沟通方面的分析,例如节奏、眼神交流、肢体语言、包容性语言、手势等。

NaturalReader

NaturalReaders是一个提供文本到语音转换服务的网站。

讯飞配音

提供文字转语音、语音合成、国内专业的一站式配音服务平台

Ztalk.ai

Ztalk.ai 是一款支持多语言实时语音翻译的AI桌面应用,具备低延迟、高清晰度和强兼容性,可与主流视频会议平台无缝连接。内置降噪、字幕及AI提示功能,确保沟通效率与质量。采用端到端加密,保障数据安全,适用于全球商务会议、跨境协作、客户互动及多语言培训等场景。

飞船 Kraft

飞船 Kraft 是一款由快手开发的AI智能对话应用,支持自然语言对话、个性化虚拟角色创建、内容创作辅助等功能。用户可通过飞船 Kraft 进行信息查询、日常生活助手、学习辅助及内容创作等活动。该应用还支持高度定制化和语音交互功能。