音频

EmotiVoice

EmotiVoice是网易有道推出的开源文本到语音系统,支持中英文及2000+音色,能根据提示生成带情感的语音。具备情感合成、语音克隆、多语言支持等功能,提供Web界面和API接口,适用于有声读物、智能助手、教育、客服等场景,技术上支持高效部署与模型微调。

TTS-Voice-Wizard

TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100...

Gemini

Gemini是Google DeepMind推出的全新AI模型,集成了多模态推理功能,超越了以往模型的性能,适用于科学文献洞察、竞争性编程等多种应用场景。

音鹿

音鹿是一款基于AI技术的音频编辑工具,主要功能包括文字转语音、音色选择、AI翻唱及音频编辑(剪切、合并、混音、音量调节、变速变调)。该工具内置大量音色模型,支持实时预览与参数调整,广泛适用于社交媒体、广告宣传、教育培训等领域,帮助用户高效完成音频创作。

KeySync

KeySync是一种高分辨率口型同步工具,由帝国理工学院和弗罗茨瓦夫大学联合开发。其采用两阶段生成框架,结合掩码策略和视频分割模型,实现音频与唇部动作的精准对齐。支持高清视频生成,具备遮挡处理、减少表情泄露等功能,在视觉质量、时间连贯性和同步精度上优于现有方法,适用于自动配音、虚拟形象、视频会议等多场景应用。

Suno AI

Suno AI 是由 Anthropic 公司开发的一款 AI 音乐和语音生成工具。 仅使用文本提示即可生成高质量的歌声、乐器和完整的音乐作品。

AI绘画箱

AI绘画箱收录近千个AI绘画工具网站,提供Midjourney、Stable Diffusion等一站式AI绘画工具、AI图片处理工具、AI素材下载、AI视频音频等工具,只做最好的AI绘画工具网址导航站。

Banger

Banger是一款基于AI技术的音乐创作工具,支持用户对现有歌曲进行翻唱创作。它提供无缝人声替换、丰富语音库、个性化设置等功能,适用于个人创作、音乐教学、社交媒体分享等多种场景。用户可选择内置模板或上传原声,生成高质量翻唱作品并进行分享。Banger简化了音乐制作流程,降低了创作门槛,适合各类音乐爱好者和创作者使用。

OpenShot

一款免费、开源的视频编辑软件,OpenShot提供丰富的视频效果、标题和音轨功能,用户可以轻松创建和编辑高质量的视频。

蓝藻AI

运用了尖端的创造性人工智能技术,致力于向用户提供流畅的自然语言处理与生成服务。这涵盖了从文字到语音的转换、语音辨识以及对话管理等多项功能。