音频

EmotiVoice

EmotiVoice是网易有道推出的开源文本到语音系统,支持中英文及2000+音色,能根据提示生成带情感的语音。具备情感合成、语音克隆、多语言支持等功能,提供Web界面和API接口,适用于有声读物、智能助手、教育、客服等场景,技术上支持高效部署与模型微调。

Audio Enhancer

一个在线音频增强工具,Audio Enhancer使用人工智能算法来帮助用户轻松地减少音频文件中的背景噪音,用于改善音频录音的清晰度和整体质量。

SongDonkey

SongDonkey是一款基于AI技术的音频处理工具,能够高效分离人声与乐器音轨,支持多种格式输出和预览功能。它适用于音乐制作、教学、分析及编辑等领域,为用户提供便捷的音频处理体验。

INFP

INFP是一款基于音频驱动的头部生成框架,专为双人对话设计,具备自动角色转换功能。它通过两个阶段实现头部生成:基于动作的头部模仿和音频引导的动作生成。同时,INFP提出了大规模双人对话数据集DyConv,推动了相关领域的研究进展。该工具适用于视频会议、虚拟助手、教育培训、客户服务等多个场景,支持实时互动并可调节生成风格。

SeeMuseums

SeeMuseums 是一款基于AI的智能导览工具,支持多语言、智能推荐和AI音频讲解,帮助用户个性化探索博物馆内容。用户可通过提问获取详细解读,记录笔记并保存收藏,适用于艺术学习、文化探索和教育辅助等多种场景,提升参观体验与知识获取效率。

Aiva.ai

我们的使命是通过使用 AI 创建个性化配乐来增强个人能力

Loudly

一种允许用户使用人工智能技术创作原创音乐的AI音乐生成器、Ai编曲软件。用户可以选择特定的流派和所需的音乐长度,Loudly AI将在几秒钟内生成独特的曲目。

Gemini

Gemini是Google DeepMind推出的全新AI模型,集成了多模态推理功能,超越了以往模型的性能,适用于科学文献洞察、竞争性编程等多种应用场景。

Suno AI

Suno AI 是由 Anthropic 公司开发的一款 AI 音乐和语音生成工具。 仅使用文本提示即可生成高质量的歌声、乐器和完整的音乐作品。

Allavsoft

一款专业的视频下载和转换工具,Allavsoft支持从 YouTube、Spotify、Vimeo 等 10000 多个网站下载视频和音频。用户可以轻松下载高清视频、音乐视频、播放列表等,并将其转换为 MP4、MP3、AVI 等多种格式。