克隆

XiHATEK-AI

通过3D数字人技术,用户可以跨越现实与虚拟的界限,享受每一次互动带来的视觉盛宴。

睿声Reecho

一款专注于5秒瞬时语音克隆和超拟真语音合成的AI语音克隆平台。

FalcoCut

一款功能非常实用的多语言本地化AI视频生成与编辑工具,支持视频翻译、换脸、音频编辑、唇同步、数字人生成等功能。

优雅YOYA

优雅(YOYA)是中科闻歌推出的多模态文生视频平台,基于大语言模型和多模态技术,支持从脚本生成到视频剪辑的全流程自动化。用户仅需输入主题,即可快速生成高质量视频,并支持语音克隆、口型翻译、数字人等功能。平台还具备多模态素材智能剪辑能力,提升创作效率与可控性,适用于媒体、影视、企业宣传及教育等领域。

Uberduck AI

一个语音自动化和文本转语音克隆平台。Uberduck提供逼真的声音,并允许用户创建自定义声音。

ChatTTSPlus

ChatTTSPlus 是一款基于深度学习的语音合成工具,它通过 TensorRT 技术实现了显著的性能提升,同时支持语音克隆、模型压缩与加速等功能。该工具不仅适用于桌面端,还能够部署于移动设备,满足多种应用场景需求,包括有声读物制作、语言学习辅助、客户服务及娱乐等领域。 ---

Fish Speech

Fish Speech是一款开源的文本到语音(TTS)工具,支持中文、英文和日文。它通过大约15万小时的多语种数据训练,实现了接近人类水平的语音合成效果。该工具的特点包括低显存需求(仅需4GB)、快速推理速度、高自定义性和灵活性。Fish Speech支持多种语音生成模型,如VITS2、Bert-VITS2等,适用于智能助手、自动客服、语言学习等多个领域。

Eleven Labs

Eleven Labs的长格式语音生成平台使用人工智能为创作者和出版商创造自然而引人注目的声音。

Coqui.ai

Coqui.ai 是一个语音技术的开源平台,Coqui.ai 通过生成式 AI 提供逼真、富有情感的文本转语音,它可以从 3 秒的音频中克隆任何声音并调整其风格、节奏和情感。

Voice Engine

Voice Engine是由OpenAI开发的AI语音合成和声音克隆技术。该技术能够通过15秒的音频样本和文本输入生成自然语音。它已在OpenAI的文本到语音API和ChatGPT的语音功能中应用。Voice Engine广泛应用于教育、翻译、远程服务提供、支持言语残障者以及帮助恢复患者声音等方面。为了确保技术安全,OpenAI实施了严格的使用政策和安全措施。