AI语音

MemenomeLM

MemenomeLM是Brainrot AI推出的AI工具,专为Z世代研究人员设计,可将PDF文档、笔记等资料转化为有趣且互动性强的视频内容。具备多模态理解能力,能用简单语言解释复杂概念并提供现实例子,支持生成多种格式的短视频,如Brainrot Quiz、Yap Dollar等,还可添加搞笑音效、生成图片及选择不同语音。

TurboTTS

TurboTTS是一款支持多语言的在线文本转语音工具,提供300多种真实语音选择,生成自然流畅的语音效果。适用于短视频、教育、广告及播客等多种场景,操作简单,支持多种音频格式下载,并可合法用于商业用途。凭借AI技术,用户能高效完成语音内容制作,满足多样化需求。

VALL

VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。具体来说,我们使用从现成的神经音频编解码器模型派生的离散代码来训练神经编解码器语言模型(称为 VALL-E),并将 TTS 视为...

Audyo

Audyo是一款文本到语音的AI语音转换器,允许用户通过打字创建和编辑人类质量的AI语音。

Reecho

通过Reecho在数秒内克隆任意声音,并创建与真人近乎无异的、极具表现力的文本配音。

Inworld AI

Inworld AI是一个综合性的AI游戏开发平台,它通过提供先进的NPC逻辑、互动剧情设计工具、实时AI反应和自然语音生成等功能,极大地增强了游戏的沉浸感和互动性。

Zonos

Zonos是一款由Zyphra开发的高保真文本到语音(TTS)模型,支持零样本语音克隆和多语言生成,具备精细的情感与语音参数控制能力。其采用Transformer和SSM混合架构,基于大规模语音数据训练,适用于有声读物、虚拟助手、多媒体创作及无障碍技术等多个领域。模型开源且支持实时语音生成,具有广泛的应用潜力。

声咔AI配音

声咔AI配音是在线配音软件平台,垂直深度音频效率工具,支持30多种个性化调音功能等,限制少对用户友好。

Spark

Spark-TTS是一款基于大型语言模型的高效文本转语音工具,支持中英文双语及跨语言合成。它无需额外生成模型,通过LLM预测编码直接生成音频,实现零样本语音克隆。用户可自定义语音参数,如音色、语速等,适用于语音助手、多语言内容创作、智能客服及虚拟角色配音等多种场景。

Arctime

简单、强大、高效的跨平台字幕制作软件