克隆 - 智狐AI导航

HeyGen

HeyGen是一款AI数字人视频创作平台，具备即时数字人视频制作、多语言翻译配音、语音克隆、文本转语音等功能。它提供了丰富的视频模板库和强大的素材库，支持用户轻松创建高质量的数字人视频。HeyGen适用于多种场景，包括讲解说明、市场营销和企业培训，助力用户提高工作效率和视频质量。

AI项目与工具 2025年06月12日 91 点赞 0 评论 640 浏览

OpenVoice

OpenVoice是一款由MyShell开发的免费开源AI语音克隆工具，其主要功能包括精准的音色和音调克隆及灵活的语音风格控制。该工具能够捕捉并复制不同语言或口音的音色，生成自然流畅的语音，并支持零样本跨语言语音克隆。开发者可以通过GitHub项目地址进行本地安装和运行，也可以通过Lepton AI、MyShell或HuggingFace提供的在线演示体验该工具。

AI项目与工具 2025年06月12日 49 点赞 0 评论 693 浏览

Voice Engine

Voice Engine是由OpenAI开发的AI语音合成和声音克隆技术。该技术能够通过15秒的音频样本和文本输入生成自然语音。它已在OpenAI的文本到语音API和ChatGPT的语音功能中应用。Voice Engine广泛应用于教育、翻译、远程服务提供、支持言语残障者以及帮助恢复患者声音等方面。为了确保技术安全，OpenAI实施了严格的使用政策和安全措施。

AI项目与工具 2024年01月01日 59 点赞 0 评论 763 浏览

Toucan TTS

Toucan TTS是一款由德国斯图加特大学自然语言处理研究所开发的文本到语音合成工具箱。它基于Python和PyTorch构建，支持超过7000种语言及多种方言和变体。主要功能包括多说话人语音合成、语音风格克隆、人机交互编辑、语音参数调整以及发音清晰度和性别特征调整。该工具箱适用于语音模型教学、文字朗读和多语言应用开发等场景，并提供在线交互式演示功能，方便用户快速理解和使用。

AI项目与工具 2025年06月12日 89 点赞 0 评论 773 浏览

Fish Speech

Fish Speech是一款开源的文本到语音（TTS）工具，支持中文、英文和日文。它通过大约15万小时的多语种数据训练，实现了接近人类水平的语音合成效果。该工具的特点包括低显存需求（仅需4GB）、快速推理速度、高自定义性和灵活性。Fish Speech支持多种语音生成模型，如VITS2、Bert-VITS2等，适用于智能助手、自动客服、语言学习等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 775 浏览

晓象

晓象是一款基于自研可信大模型的AI克隆工具，可创建各领域知识博主的虚拟分身。该工具能够模仿博主的声音、风格和表达方式，生成个性化的高质量内容，并支持实时互动，帮助用户获取知识分享和信息解读。应用场景广泛，包括知识传播、教育辅助、内容创作及信息解读。

AI项目与工具 2025年06月12日 50 点赞 0 评论 630 浏览

Boogie AI

Boogie AI 是一款利用人工智能技术将用户上传的照片转化为舞蹈视频的应用程序。该应用具备AI舞蹈生成、动作选择、声音克隆和图生视频等功能，用户可以上传照片并选择不同的舞蹈动作，通过AI技术生成动态的舞蹈视频。该应用可应用于社交媒体分享、家庭聚会、朋友互动、个人娱乐和创意表达等多个场景，提供了一种独特且有趣的娱乐方式。

AI项目与工具 2025年06月12日 54 点赞 0 评论 535 浏览

Tavus – AI视频生成平台，支持数字人克隆和实时对话

Tavus 是一个先进的 AI 视频生成平台，提供逼真的数字人克隆和实时对话式视频。基于 Phoenix-2 模型和对话式视频接口（CVI），Tavus 支持企业快速部署 AI 视频产品，提升用户体验并确保安全合规。主要功能包括 AI 视频生成、实时对话、开发者文档和工具，适用于客户服务、个性化营销、虚拟助手、教育和产品演示等多种应用场景。

AI项目与工具 2025年01月28日 44 点赞 0 评论 536 浏览

MetaHuman

MetaHuman-Stream 是一种先进的实时交互流式AI数字人技术，集成了多种尖端模型，支持声音克隆和深度学习算法，确保对话流畅自然。通过全身视频整合和低延迟通信技术，提供沉浸式的用户体验，适用于在线教育、客户服务、游戏和新闻等多个领域。其主要功能包括多模型支持、声音克隆、对话处理能力和全身视频整合。

AI项目与工具 2025年06月12日 91 点赞 0 评论 635 浏览

MARS5

MARS5-TTS是一款开源的AI声音克隆工具，支持140多种语言的文本转语音功能。它能够生成高度逼真的语音，并处理复杂的韵律场景。该工具拥有12亿参数，基于超过15万小时的训练数据。用户可以通过文本中的标点符号和大小写等标记引导语音的韵律和情感，同时提供快速克隆和深度克隆两种模式。MARS5-TTS可应用于内容创作、语言学习、辅助技术、客户服务和多媒体娱乐等多种场景。

AI项目与工具 2025年06月12日 53 点赞 0 评论 546 浏览

克隆

首页

克隆

列表

默认

浏览次数

发布日期