音频

NovaVSS

影视音轨分离工具,搭载专为电影电视训练的最强影视音轨分离AI模型,可一键从电影电视中提取人声、音乐、特效声。

Adobe Premiere Pro

基于文本的AI视频编辑,支持语音转录功能, 自动生成文字稿,简化视频剪辑流程,像编辑文本文档一样编辑视频。

MuCodec

MuCodec是一款由清华大学等机构联合研发的超低比特率音乐编解码工具,具备音乐压缩、特征提取、离散化处理及流匹配重建等功能。该工具能够有效压缩音乐文件,在极低比特率下仍能保证高保真度,适用于多种应用场景如在线音乐流媒体服务、音乐下载、语言模型构建以及移动设备优化等。

M2UGen

M2UGen是由腾讯PCG ARC实验室与新加坡国立大学共同研发的一款多模态音乐理解和生成框架,支持从文本、图像、视频等多种模态输入生成相应音乐。它具有强大的音乐理解能力、灵活的音乐编辑功能以及多样化的应用场景,适用于音乐制作、影视配乐、音乐教育等多个领域。凭借其创新的技术架构和卓越的表现力,M2UGen已成为当前最优秀的多模态音乐生成工具之一。

OptimizerAI

一个专门为视频自动生成音效的AI工具,可以为AI视频自动配音,能够通过文字提示创造出适用于各种场景的声音和音效。

MultiTalk

MultiTalk是由中山大学深圳校区、美团和香港科技大学联合推出的音频驱动多人对话视频生成框架。它根据多声道音频输入、参考图像和文本提示,生成包含人物互动且口型与音频一致的视频。通过Label Rotary Position Embedding (L-RoPE) 方法解决多声道音频与人物绑定问题,并采用部分参数训练和多任务训练策略,保留基础模型的指令跟随能力。MultiTalk适用于卡通、歌唱及

AskNow AI

一个创新的AI问答平台,AskNow AI使用户能够与不同领域的各种知名人士和专家进行个性化的音频对话。

MakeBestMusic

MakeBestMusic 是一款基于AI技术的音乐创作工具,支持通过文本生成音乐、音频分离、混音与重制等功能,覆盖多种音乐风格。提供多种付费计划,满足不同用户需求,适用于音乐制作、视频创作、游戏开发等场景,提升创作效率与质量。

AudioGen.co

一款由AI驱动的可以生成各种音频内容的平台,包括样品、乐器、音效和纹理。用户可以生成高质量的、适合制作专业的具有无限的变化音乐的声音