克隆 - 智狐AI导航

SenseVoice

一款阿里通义实验室发布的FunAudioLLM框架多语言音频基础模型，SenseVoice具有多语种、混合语言、音色和情感控制能力。

Ai语音工具 2025年06月05日 58 点赞 0 评论 780 浏览

Fish Speech

Fish Speech是一款开源的文本到语音（TTS）工具，支持中文、英文和日文。它通过大约15万小时的多语种数据训练，实现了接近人类水平的语音合成效果。该工具的特点包括低显存需求（仅需4GB）、快速推理速度、高自定义性和灵活性。Fish Speech支持多种语音生成模型，如VITS2、Bert-VITS2等，适用于智能助手、自动客服、语言学习等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 776 浏览

Toucan TTS

Toucan TTS是一款由德国斯图加特大学自然语言处理研究所开发的文本到语音合成工具箱。它基于Python和PyTorch构建，支持超过7000种语言及多种方言和变体。主要功能包括多说话人语音合成、语音风格克隆、人机交互编辑、语音参数调整以及发音清晰度和性别特征调整。该工具箱适用于语音模型教学、文字朗读和多语言应用开发等场景，并提供在线交互式演示功能，方便用户快速理解和使用。

AI项目与工具 2025年06月12日 89 点赞 0 评论 774 浏览

ChatTTSPlus

ChatTTSPlus 是一款基于深度学习的语音合成工具，它通过 TensorRT 技术实现了显著的性能提升，同时支持语音克隆、模型压缩与加速等功能。该工具不仅适用于桌面端，还能够部署于移动设备，满足多种应用场景需求，包括有声读物制作、语言学习辅助、客户服务及娱乐等领域。 ---

AI项目与工具 2025年06月12日 13 点赞 0 评论 771 浏览

XiHATEK-AI

通过3D数字人技术，用户可以跨越现实与虚拟的界限，享受每一次互动带来的视觉盛宴。

Ai视频生成 2026年06月21日 0 点赞 0 评论 770 浏览

Coqui.ai

Coqui.ai 是一个语音技术的开源平台，Coqui.ai 通过生成式 AI 提供逼真、富有情感的文本转语音，它可以从 3 秒的音频中克隆任何声音并调整其风格、节奏和情感。

Ai语音工具 2025年06月05日 64 点赞 0 评论 769 浏览

A2E

A2E是一款基于AI技术的数字人视频创作平台，支持通过照片、视频或文本生成高度逼真的虚拟形象，具备声音克隆、多语言翻译、视频生成及形象换脸等功能。适用于内容创作、教育、营销等多个领域，帮助用户降低创作门槛，提升内容效率与表现力。

AI项目与工具 2025年06月11日 61 点赞 0 评论 767 浏览

Mureka O1

Mureka O1是昆仑万维推出的全球首款音乐推理大模型，采用“思维链”技术提升音乐生成质量与创作效率。支持多语言AI音乐创作，涵盖多种风格与情感表达，具备歌词生成、风格控制、音色克隆等功能。提供API接口与模型微调能力，适用于广告、影视、游戏、教育等多个场景，助力创作者高效完成音乐创作任务。

AI项目与工具 2025年06月12日 39 点赞 0 评论 766 浏览

YouDub

一款开源的多语言AI配音和视频翻译工具，优质视频中文化工具，YouDub-webui提供了一套完整的视频中文化工具包，涵盖了从视频下载、语音识别、字幕翻译、AI声音克隆、视频处理、自动上传等一系列流程。

Ai开源项目 2025年06月05日 89 点赞 0 评论 764 浏览

Voice Engine

Voice Engine是由OpenAI开发的AI语音合成和声音克隆技术。该技术能够通过15秒的音频样本和文本输入生成自然语音。它已在OpenAI的文本到语音API和ChatGPT的语音功能中应用。Voice Engine广泛应用于教育、翻译、远程服务提供、支持言语残障者以及帮助恢复患者声音等方面。为了确保技术安全，OpenAI实施了严格的使用政策和安全措施。

AI项目与工具 2024年01月01日 59 点赞 0 评论 763 浏览

克隆

首页

克隆

列表

默认

浏览次数

发布日期