音频生成 - 智狐AI导航

TurboTTS

TurboTTS是一款支持多语言的在线文本转语音工具，提供300多种真实语音选择，生成自然流畅的语音效果。适用于短视频、教育、广告及播客等多种场景，操作简单，支持多种音频格式下载，并可合法用于商业用途。凭借AI技术，用户能高效完成语音内容制作，满足多样化需求。

AI项目与工具 2025年06月12日 20 点赞 0 评论 582 浏览

GenSFX

GenSFX 是一款基于 AI 的在线音效生成工具，可根据文本描述快速生成高质量音效，支持环境音、自然声、动物叫声、机械声、科幻音效等多种类型。用户可自定义参数并下载多种格式的音频文件，适用于视频制作、游戏开发、播客和广告等多个领域，提升内容创作效率与表现力。

AI项目与工具 2025年06月12日 94 点赞 0 评论 651 浏览

Jellypod

Jellypod 是一款基于 AI 的播客制作工具，支持从网页、PDF 等多种格式自动生成脚本并转为音频，涵盖 30 多种语言和口音。用户可自定义 AI 主持人，编辑脚本并一键发布到主流平台，具备高质量音频生成与内容管理功能，适用于企业、教育和个人品牌建设等场景。

AI项目与工具 2025年06月12日 80 点赞 0 评论 627 浏览

Kokoro

Kokoro-TTS是一款由hexgrad开发的轻量级文本转语音工具，基于StyleTTS 2与ISTFTNet架构，支持多种语音风格和自然语调，具备实时处理能力。支持美式与英式英语，提供10种语音包，适用于教育、游戏、客服等多种场景。支持本地部署与API集成，确保数据安全与高效运行。

AI项目与工具 2025年06月12日 33 点赞 0 评论 930 浏览

Fineshare FineVoice

Fineshare FineVoice 是一款多功能 AI 配音生成工具，支持文本转语音、语音转文本、AI 变声、声音克隆和音频生成等功能。提供超过 1500 种声音和 149 种语言选项，适用于视频制作、播客、教育、营销等多种场景，助力用户高效创作高质量的多语言内容。具备强大的自定义能力和便捷操作，适合个人与企业用户使用。

AI项目与工具 2025年06月12日 87 点赞 0 评论 835 浏览

Ondoku

Ondoku 是一款支持多语言的文字转语音工具，提供文本输入、图片文字提取及语音调整功能。用户可将文本或图片中的文字转换为自然语音，并下载为音频文件。适用于教育、娱乐、商务等多种场景，如课程讲解、有声书制作和视频配音，提升信息传播效率。

AI项目与工具 2025年06月12日 41 点赞 0 评论 591 浏览

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型，具备约5.15亿参数量，能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出，支持多种应用场景，包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。

AI项目与工具 2025年06月12日 73 点赞 0 评论 479 浏览

Luvvoice

Luvvoice 是一款基于 AI 技术的在线文本到语音转换平台，提供超过 200 种高质量 AI 声音和 70 多种语言选项。用户可以通过上传 PDF 或 TXT 文件，将文本快速转换为自然语音，适用于教育、内容创作、营销及无障碍服务等多个场景。平台支持多种语言调节功能，生成的音频文件支持 MP3 格式下载。

AI项目与工具 2025年06月12日 33 点赞 0 评论 774 浏览

Sketch2Sound

Sketch2Sound是一种由Adobe研究院与西北大学联合开发的AI音频生成技术，通过提取响度、亮度和音高概率等控制信号，结合文本提示生成高质量音效。其轻量化设计使得模型易于适配多种文本到音频框架，同时赋予声音设计师更强的表达力与可控性，广泛适用于电影、游戏、音乐制作及教育等多个领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 888 浏览

Fugatto

Fugatto是一款由英伟达开发的音频合成与转换模型，利用增强型Transformer架构实现了从文本到音频的高效转化。它支持多种音频生成任务，如音乐创作、声音效果设计及语音合成，并可通过ComposableART技术实现对声音属性的精细调控。此外，Fugatto擅长生成动态变化的声音景观，广泛应用于音乐创作、声音设计及广告音频制作等领域。

AI项目与工具 2025年06月12日 44 点赞 0 评论 559 浏览

音频生成

首页

音频生成

列表

默认

浏览次数

发布日期