克隆

Medio.cool

Medio.cool是一款面向企业海外市场的AI视频编辑工具,提供视频水印去除、商品翻译、商品解说视频自动生成等功能。它支持多语言翻译,涵盖超过100种国际语言,并能一键下载4K高清原视频,适用于YouTube、TikTok等多个平台,助力企业高效实现全球化推广。

歌歌AI

歌歌AI写歌 是一个旨在让每个人都能成为音乐家的平台,它通过人工智能技术,提供了一种创新的方式来创作音乐。

FishAudio

一个在线AI文本转语音合成配音声音克隆平台,以其自然、富有表现力的语音生成技术,为用户带来了前所未有的音频体验。

Fish Audio

Fish Audio是一款生成式AI文本转语音(TTS)和声音克隆平台,支持多种语言和声音风格,可将文本转换为自然流畅的语音。用户可上传音频样本克隆特定人物的声音,并通过API接口集成到应用程序中。Fish Audio适用于视频制作、有声读物、语音助手、教育与培训以及娱乐创意等领域,满足个性化语音内容生成需求。

T2A

T2A-01-HD是一款支持声音克隆与多语言合成的AI语音模型,可精准还原原声特征与情感表达。具备智能情感系统、多语言支持及高级参数控制功能,适用于有声读物、影视配音、教育、语言学习等多种场景,提供高质量、个性化的语音输出。

给麦

给麦是一款集成了AI技术的音乐创作平台,主要面向音乐创作者、歌手及普通用户。它提供音色克隆、快速歌曲合成、AI翻唱、AI写歌等功能,同时拥有线上K歌、虚拟人声、语聊派对和破冰游戏等社交娱乐功能,旨在帮助用户轻松创作音乐并享受互动体验。

ToucanTTS

一套用于最先进语音合成的工具包,ToucanTTS覆盖超过7,000种语言的大型多语言模型。

OuteTTS

OuteTTS是一款基于开源技术的文本到语音(TTS)工具,利用纯语言建模方法生成自然语音。它支持语音克隆和自定义说话人声音,具备音频标记化、CTC强制对齐和结构化提示创建等功能。OuteTTS与llama.cpp和GGUF格式兼容,适用于有声读物、智能客服、语音导航等多种应用场景。

Chatterbox

Chatterbox是Resemble AI推出的开源文本转语音(TTS)模型,基于0.5B规模的LLaMA架构,用超过50万小时精选音频训练。它支持零样本语音克隆,仅需5秒参考音频即可生成高度逼真的个性化语音,并具备情感夸张控制功能,可调节情绪、语速和语调。Chatterbox还拥有超低延迟的实时语音合成能力,延迟低至200毫秒以下,适用于交互式应用。此外,它采用安全水印技术防止滥用,适用于内容

怪兽AI数字人

怪兽AI数字人为怪兽智能科技推出的产品,包含全息交互数字人、3D超写实交互数字人,AIGC生产、SaaS短视频创作管理和直播服务平台。