文本转语音

NeMo

NeMo 是一款基于 NVIDIA 技术的端到端云原生框架，专为生成式 AI 模型的设计与部署而打造。它具备模块化架构、多模态支持、优化算法及分布式训练能力，可应用于语音识别、自然语言处理、文本到语音转换、对话式 AI 等多个领域，同时支持预训练模型微调和端到端开发流程，为企业提供高效灵活的解决方案。

AI项目与工具 2025年06月12日 38 点赞 0 评论 733 浏览

Spiritme AI

一款AI视频平台，可以让用户通过数字化化身生成个性化视频。该平台利用人工智能技术，帮助用户轻松创建独特和引人入胜的视频。

Ai视频生成 2025年06月05日 30 点赞 0 评论 725 浏览

All Voice Lab

All Voice Lab是一款基于AI技术的语音创作平台，提供文本转语音、声音克隆、视频翻译、变声等多种功能，支持多语言及多音色转换。平台具备高精度的语音生成能力，可应用于内容创作、视频制作、教育及娱乐等领域，提升内容表现力与国际化传播效率。

AI项目与工具 2025年06月12日 14 点赞 0 评论 717 浏览

Text to Bark

Text to Bark 是由 ElevenLabs 推出的全球首个 AI 狗语文本转语音模型，能将文字转化为高度逼真的狗吠声，支持多种犬种选择和语气调整。技术基于深度学习和犬类语言学研究，适用于宠物训练、科研、娱乐及家庭互动等多种场景，具备良好的可扩展性和实用性。

AI项目与工具 2025年06月12日 47 点赞 0 评论 713 浏览

大饼AI变声

大饼AI变声，自然人声效果，千种音色选择，全场景接入支持，专注于声音领域，除了实时变声，大饼AI变声还为声音从业者打造了音色转换工具，为内容创作者提供了文本转语音等功能。

Ai语音工具 2025年06月05日 47 点赞 0 评论 710 浏览

OCTAVE

OCTAVE是一款由Hume AI研发的语音语言处理工具，融合了多种领先AI技术，具备强大的个性化语音生成能力，支持从文字到语音的即时转化，并能精准模仿不同说话者的声线与情感表达。其主要功能包括多角色对话生成、复杂指令理解与响应，以及实时语音处理等。此外，OCTAVE可应用于客户服务、虚拟助手、教育培训、娱乐游戏等多个领域，为用户带来更加自然、生动的交互体验。

AI项目与工具 2025年06月12日 14 点赞 0 评论 701 浏览

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型，支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构，具备多语言支持及长文本处理能力，适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本，支持零样本学习，提升语音自然度和表现力。

AI项目与工具 2025年06月12日 71 点赞 0 评论 697 浏览

Fish Speech 1.5

Fish Speech 1.5是一款基于深度学习的文本转语音（TTS）工具，支持多语言文本输入，通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力，延迟时间短，无需依赖音素，泛化性强，且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 692 浏览

audiobot

audiobot是一款利用AI技术实现文本到语音转换的服务平台，支持多语言及多样化的声音选项。其主要功能包括文本转语音处理、多语言兼容性、即时音频生成及高质量MP3下载等。广泛应用于视频制作、有声读物创作、商业宣传及教育培训等领域，满足用户对专业音频内容的需求。

AI项目与工具 2025年06月12日 86 点赞 0 评论 683 浏览

DupDub

DupDub是一款由出门问问开发的AI内容生成平台，集成了AI写作、文本转语音、视频编辑等多项功能，支持70多种语言和500多种真实语音效果。它通过简化创作流程，帮助内容创作者快速生成高质量的视频、文本和音频内容，适用于营销、教育、无障碍辅助等多种应用场景，有效提升工作效率与内容影响力。

AI项目与工具 2025年06月12日 62 点赞 0 评论 659 浏览

文本转语音

首页

文本转语音

列表

默认

浏览次数

发布日期