Sketch2Sound Sketch2Sound是一种由Adobe研究院与西北大学联合开发的AI音频生成技术,通过提取响度、亮度和音高概率等控制信号,结合文本提示生成高质量音效。其轻量化设计使得模型易于适配多种文本到音频框架,同时赋予声音设计师更强的表达力与可控性,广泛适用于电影、游戏、音乐制作及教育等多个领域。 AI项目与工具 2025年06月12日 35 点赞 0 评论 479 浏览
Luvvoice Luvvoice 是一款基于 AI 技术的在线文本到语音转换平台,提供超过 200 种高质量 AI 声音和 70 多种语言选项。用户可以通过上传 PDF 或 TXT 文件,将文本快速转换为自然语音,适用于教育、内容创作、营销及无障碍服务等多个场景。平台支持多种语言调节功能,生成的音频文件支持 MP3 格式下载。 AI项目与工具 2025年06月12日 33 点赞 0 评论 391 浏览
TANGOFLUX TANGOFLUX是一款高效文本到音频生成模型,具备约5.15亿参数量,能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出,支持多种应用场景,包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。 AI项目与工具 2025年06月12日 73 点赞 0 评论 144 浏览
Ondoku Ondoku 是一款支持多语言的文字转语音工具,提供文本输入、图片文字提取及语音调整功能。用户可将文本或图片中的文字转换为自然语音,并下载为音频文件。适用于教育、娱乐、商务等多种场景,如课程讲解、有声书制作和视频配音,提升信息传播效率。 AI项目与工具 2025年06月12日 41 点赞 0 评论 223 浏览
Fineshare FineVoice Fineshare FineVoice 是一款多功能 AI 配音生成工具,支持文本转语音、语音转文本、AI 变声、声音克隆和音频生成等功能。提供超过 1500 种声音和 149 种语言选项,适用于视频制作、播客、教育、营销等多种场景,助力用户高效创作高质量的多语言内容。具备强大的自定义能力和便捷操作,适合个人与企业用户使用。 AI项目与工具 2025年06月12日 87 点赞 0 评论 426 浏览
Kokoro Kokoro-TTS是一款由hexgrad开发的轻量级文本转语音工具,基于StyleTTS 2与ISTFTNet架构,支持多种语音风格和自然语调,具备实时处理能力。支持美式与英式英语,提供10种语音包,适用于教育、游戏、客服等多种场景。支持本地部署与API集成,确保数据安全与高效运行。 AI项目与工具 2025年06月12日 33 点赞 0 评论 505 浏览
Jellypod Jellypod 是一款基于 AI 的播客制作工具,支持从网页、PDF 等多种格式自动生成脚本并转为音频,涵盖 30 多种语言和口音。用户可自定义 AI 主持人,编辑脚本并一键发布到主流平台,具备高质量音频生成与内容管理功能,适用于企业、教育和个人品牌建设等场景。 AI项目与工具 2025年06月12日 80 点赞 0 评论 212 浏览
GenSFX GenSFX 是一款基于 AI 的在线音效生成工具,可根据文本描述快速生成高质量音效,支持环境音、自然声、动物叫声、机械声、科幻音效等多种类型。用户可自定义参数并下载多种格式的音频文件,适用于视频制作、游戏开发、播客和广告等多个领域,提升内容创作效率与表现力。 AI项目与工具 2025年06月12日 94 点赞 0 评论 310 浏览
TurboTTS TurboTTS是一款支持多语言的在线文本转语音工具,提供300多种真实语音选择,生成自然流畅的语音效果。适用于短视频、教育、广告及播客等多种场景,操作简单,支持多种音频格式下载,并可合法用于商业用途。凭借AI技术,用户能高效完成语音内容制作,满足多样化需求。 AI项目与工具 2025年06月12日 20 点赞 0 评论 232 浏览
AudioX AudioX 是一种基于多模态输入的音频生成模型,支持文本、视频、图像等多种输入方式,能够生成高质量的音频和音乐。其核心创新在于多模态掩码训练策略,提升了跨模态理解和生成能力。具备零样本生成、自然语言控制及强大的泛化能力,适用于视频配乐、动画音效、音乐创作等多个场景。 AI项目与工具 2025年06月12日 68 点赞 0 评论 157 浏览