语音合成 - 智狐AI导航

Chatterbox

Chatterbox是Resemble AI推出的开源文本转语音（TTS）模型，基于0.5B规模的LLaMA架构，用超过50万小时精选音频训练。它支持零样本语音克隆，仅需5秒参考音频即可生成高度逼真的个性化语音，并具备情感夸张控制功能，可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力，延迟低至200毫秒以下，适用于交互式应用。此外，它采用安全水印技术防止滥用，适用于内容

AI项目与工具 2025年06月11日 55 点赞 0 评论 514 浏览

Audo Studio

Audo AI为创作者和开发人员提供噪声消除产品，包括Audo Studio、Audo API和用于Linux的Magic Mic。这些产品利用音频处理和人工智能的最新进展，自动去除背景噪音，增强音频录制，...

创作工具 2026年06月21日 0 点赞 0 评论 511 浏览

ReadSpeaker

ReadSpeaker 提供了一系列强大的文本转语音解决方案，可在任何环境中即时部署逼真、定制的语音交互。

创作工具 2026年06月21日 0 点赞 0 评论 505 浏览

自得语音

自得语音技术可通过简单的步骤创造出属于你的角色。类似GPT，可生成与真人无异的语音片段，在情感、音色和语速等方面与真人一致。

Ai语音工具 2025年06月05日 15 点赞 0 评论 504 浏览

清图

清图 - 模糊图片秒变清晰，一个基于深度学习技术的在线图像处理平台

图片处理 2026年06月21日 0 点赞 0 评论 497 浏览

Dubbing大饼AI声音

大饼AI变声器，自然人声效果，千种音色选择，全场景接入支持

创作工具 2026年06月21日 0 点赞 0 评论 496 浏览

Indic Parler

Indic Parler-TTS 是一款由 Hugging Face 与 AI4Bharat 联合开发的多语言文本到语音模型，支持 20 种印度语言和英语，提供 69 种独特语音。该模型基于深度学习架构，通过描述性文本输入实现对音调、语速、情感等参数的灵活控制，适用于多种语音合成场景。在低资源语言上表现优异，具备高自然度和清晰度的语音输出能力。

AI项目与工具 2025年06月12日 55 点赞 0 评论 494 浏览

ListenHub

ListenHub 是一款基于 AI 技术的播客生成工具，支持中英文内容处理，可快速生成高质量播客。它能自动生成主题、脚本，并提供超真实人声体验。用户可自定义角色、编辑音频并一键发布至多个平台，适用于个人创作、知识分享和娱乐休闲等多种场景。

AI项目与工具 2025年06月11日 57 点赞 0 评论 491 浏览

Hertz

Hertz-Dev是一款由Standard Intelligence开发的开源音频模型，专注于低延迟实时对话AI。它具备强大的音频生成与处理能力，能够处理和生成高质量的音频信号，并支持多任务微调，适用于语音识别、语音合成等多种应用场景。此外，Hertz-Dev还提供了音频自动编码、流式生成等功能，广泛应用于智能助手、客户服务、语音识别及合成等领域。

AI项目与工具 2025年06月12日 48 点赞 0 评论 490 浏览

IndexTTS

IndexTTS 是一款由 B 站开发的高性能文本转语音系统，专注于中文语音合成，支持拼音纠正、精准停顿控制和高自然度语音输出。采用混合建模方法，结合汉字与拼音，提升发音准确性。系统具备零样本语音克隆能力，音质优秀，广泛应用于内容创作、在线教育、智能客服等领域。训练数据丰富，性能指标优异，包括低字词错误率、高扬声器相似性和高主观音质评分。

AI项目与工具 2025年06月12日 15 点赞 0 评论 489 浏览

语音合成

首页

语音合成

列表

默认

浏览次数

发布日期