音频

AudioStrip

AudioStrip 是一种使用AI和深度学习将人声从音频文件中的背景音乐分离出来的工具。

TTSMaker马克配音

免费的AI配音平台,可以将文本转换成语音,支持50多种语言和300多种语音风格

MetaVoice Studio

MetaVoice Studio允许用户录制自己的声音或上传文件来创建自定义语音剪辑。它提供了一个免费的计划,有6个声音,30秒的剪辑长度,和一个非商业许可。付费计划包括8个声音、10分钟...

Notta

Notta是由MIND CRUISER LIMITED推出的语音转写软件,主要针对个人使用,并在海外拥有数十万用户。这款软件具有录音实时转写、音/视频导入转写、文本多格式导出、音频标记等功能,...

Adobe Podcast

Adobe Podcast是一个基于Web的平台,提供AI音频录制和编辑功能。用户可以轻松录制、转录、编辑和分享高质量的音频内容,效果清晰明了。

ImageBind

ImageBind是由Meta公司开发的开源多模态AI模型,能够整合文本、音频、视觉、温度和运动数据等多种模态的信息,并将其统一到一个嵌入空间中。该模型通过图像模态实现其他模态数据的隐式对齐,支持跨模态检索和零样本学习。它在增强现实(AR)、虚拟现实(VR)、内容推荐系统、自动标注和元数据生成等领域有广泛应用。

boomy

创建生成音乐,与世界分享.

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具,基于超10万小时播客数据训练,支持零样本语音合成与说话人适配,可在0.33秒内生成1秒音频,适合实时与长内容合成。支持本地部署与API调用,应用于播客、有声书、视频配音、AI角色及新闻播报等领域,兼具高效性与灵活性。

Audio Decomposition

Audio Decomposition 是一款基于傅里叶变换和信封匹配技术的开源音频处理工具,能够分离音乐中的不同乐器声音并生成乐谱。它支持音乐转录、教育、制作及分析,通过深度音频处理为用户提供了强大的音乐解析能力。

刺鸟配音

一款专业文字转语音的有情绪的配音软件,刺鸟配音声音媲美真人的AI配音技术,可以为你轻松配出好声音。