SongGen SongGen是一款由多家高校和研究机构联合开发的单阶段自回归Transformer模型,能够根据文本生成高质量音乐。它支持混合模式和双轨模式输出,可分别生成人声与伴奏,便于后期编辑。SongGen通过创新的音频标记化和训练策略,显著提升了人声清晰度和音乐自然度。其开源特性及高质量数据集为音乐生成研究提供了新基准,适用于音乐创作、视频配乐、教育辅助等多个领域。 AI项目与工具 2025年06月12日 78 点赞 0 评论 708 浏览
MegaTTS 3 MegaTTS 3是由字节跳动与浙江大学合作开发的零样本文本到语音合成系统,采用轻量级扩散模型,支持中英文及混合语音合成,具备语音克隆、音色控制、韵律调节等功能。系统通过分解语音属性实现精准建模,可快速生成高质量语音,适用于教育、内容制作、语音交互等多个领域。 AI项目与工具 2025年06月12日 29 点赞 0 评论 709 浏览
pipio pipio是一款专业的视频AI配音工具,集成了高精度的口型匹配技术、多语言翻译能力和高质量的声音克隆功能。它支持超过40种语言,能够快速实现视频内容的本地化,适用于国际营销、教育培训、娱乐传媒等多个领域,显著提高了跨语言视频制作的效率。 AI项目与工具 2025年06月12日 15 点赞 0 评论 712 浏览
Remaker Remaker是一个在线AI工具,专注于创意内容的生成。它利用生成式AI技术,为用户提供了多种功能,包括AI换脸、批量换脸、多人换脸、视频换脸等,满足不同场景下的内容创作需求。 Ai视频生成 2026年06月21日 0 点赞 0 评论 712 浏览
All Voice Lab All Voice Lab是一款基于AI技术的语音创作平台,提供文本转语音、声音克隆、视频翻译、变声等多种功能,支持多语言及多音色转换。平台具备高精度的语音生成能力,可应用于内容创作、视频制作、教育及娱乐等领域,提升内容表现力与国际化传播效率。 AI项目与工具 2025年06月12日 14 点赞 0 评论 717 浏览
绘声美音 绘声美音是一款集声音克隆、AI变声、文字转语音及多种音频处理功能于一体的在线工具,用户可通过微信公众号便捷使用。支持上传语音训练专属声纹模型,进行歌曲翻唱并生成MV,同时提供变声、音频提取、听歌识曲等功能,适用于娱乐、配音、创作等多种场景。 AI项目与工具 2025年06月12日 39 点赞 0 评论 721 浏览
VERBALATE VERBALATE是一款基于AI的视频翻译与配音工具,支持多语言翻译及口型同步,适用于教育、娱乐、企业培训等场景。其主要功能包括视频翻译、声音克隆、口型同步、多语言支持及长视频处理,界面友好且操作简便,为企业和个人用户提供高效的多语言内容解决方案。 AI项目与工具 2025年06月12日 97 点赞 0 评论 721 浏览
ViiTor AI ViiTor AI是一款基于人工智能技术的创新平台,集成了视频翻译、语音克隆、动态语音合成等功能,支持多语言处理。它能够将静态内容转化为动态形式,同时实现跨语言交流,适用于个人创作者、教育机构、跨国企业和翻译行业,帮助企业提升全球化竞争力。 AI项目与工具 2025年06月12日 86 点赞 0 评论 739 浏览
FalcoCut 一款功能非常实用的多语言本地化AI视频生成与编辑工具,支持视频翻译、换脸、音频编辑、唇同步、数字人生成等功能。 Ai视频生成 2025年06月05日 95 点赞 0 评论 741 浏览