TTS

Open NotebookLM

Open NotebookLM是一个开源工具,能够将PDF文档转换为播客形式的音频内容。它基于Llama 3.1 405B、MeloTTS和Bark等先进AI模型,生成自然流畅的对话式音频,并支持多语言及个性化音调设置。用户可通过简单易用的Gradio界面上传PDF文件并下载MP3格式的音频文件,适用于教育、科研、商业分析等多个领域。

纸飞机AI

纸飞机AI是一款依托人工智能技术的虚拟陪伴应用,允许用户创建个性化AI智能体,提供情感支持、互动陪伴及社交体验。具备逼真的文本转语音功能,支持多角色选择和多样化的互动形式,包括朋友圈社交与角色对话创作。广泛应用于社交训练、情感支持、娱乐休闲及语言学习等领域。

TikTok Voice

TikTok Voice 是一款基于人工智能的文字转语音工具,提供多种声音选项,支持多种语言和口音。它能将文本转换成清晰自然的语音,适用于视频编辑、文本朗读、有声电子书制作等多个场景。该工具界面简洁,操作便捷,且完全免费,适合全球用户使用。

Fish Speech

Fish Speech是一款开源的文本到语音(TTS)工具,支持中文、英文和日文。它通过大约15万小时的多语种数据训练,实现了接近人类水平的语音合成效果。该工具的特点包括低显存需求(仅需4GB)、快速推理速度、高自定义性和灵活性。Fish Speech支持多种语音生成模型,如VITS2、Bert-VITS2等,适用于智能助手、自动客服、语言学习等多个领域。

Toucan TTS

Toucan TTS是一款由德国斯图加特大学自然语言处理研究所开发的文本到语音合成工具箱。它基于Python和PyTorch构建,支持超过7000种语言及多种方言和变体。主要功能包括多说话人语音合成、语音风格克隆、人机交互编辑、语音参数调整以及发音清晰度和性别特征调整。该工具箱适用于语音模型教学、文字朗读和多语言应用开发等场景,并提供在线交互式演示功能,方便用户快速理解和使用。

Parler

Parler-TTS是一款由Hugging Face开发的开源文本到语音(TTS)模型,能够模仿特定说话者的风格,生成高质量、自然的语音。该模型采用轻量级设计,包括文本编码器、解码器和音频编解码器,通过整合文本描述和嵌入层,优化了语音生成过程。Parler-TTS的所有资源公开,促进了高质量、可控TTS模型的发展。此外,用户还可以根据需要对模型进行自定义训练和微调。

MeloTTS

MeloTTS是一个高质量的多语言文本转语音(TTS)库,由MyShell AI开发。该工具支持多种语言的文本转语音任务,包括英语(含不同口音)、西班牙语、法语、中文、日语和韩语,并具备快速的语音合成速度。MeloTTS不仅支持中英混合发音,还易于安装和使用,适用于多种操作系统和环境。用户可以在GitHub和Hugging Face平台上获取和体验MeloTTS。

麦句

不仅为用户提供了一种新颖的娱乐方式,也为需要情感支持和交流的人提供了一个平台。

TTSMaker马克配音

免费的AI配音平台,可以将文本转换成语音,支持50多种语言和300多种语音风格

MotionSound

MotionSound是一款智能AI语音生成器,采用领先的语音合成技术,利用深度学习算法和自然语言处理技术,生成自然流畅、声音清晰、表达准确的语音。这款工具支持多种语言和声音类型,...