音频 - 智狐AI导航

Enhance Speech

一款由 Adobe 出品的录音增强工具，可以去除音频背景噪音，让语音或者录音听起来就像在专业录音室中录制一样，使音频具有专业录音室品质录音的干净、专业的声音。

Ai语音工具 2025年06月05日 29 点赞 0 评论 731 浏览

音鹿

音鹿是一款基于AI技术的音频编辑工具，主要功能包括文字转语音、音色选择、AI翻唱及音频编辑（剪切、合并、混音、音量调节、变速变调）。该工具内置大量音色模型，支持实时预览与参数调整，广泛适用于社交媒体、广告宣传、教育培训等领域，帮助用户高效完成音频创作。

AI项目与工具 2025年06月12日 73 点赞 0 评论 732 浏览

OpenShot

一款免费、开源的视频编辑软件，OpenShot提供丰富的视频效果、标题和音轨功能，用户可以轻松创建和编辑高质量的视频。

视频剪辑 2025年06月05日 80 点赞 0 评论 734 浏览

TTS-Voice-Wizard

TTS语音向导是一种工具，允许用户通过微软Azure语音识别和TTS将语音转换为文本，然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项，包括100...

Ai语音工具 2026年06月21日 0 点赞 0 评论 734 浏览

Movie Gen

Movie Gen是Meta开发的一款AI视频生成与编辑工具，支持根据文本提示生成高清视频并提供同步音频配制。该工具具备强大的视频生成能力，可创建长达16秒的高清视频，并支持照片定制化视频生成和精准编辑功能。此外，它还拥有先进的音频生成技术，能够生成高质量的环境音效和背景音乐。当前，Movie Gen主要服务于Meta内部团队及部分合作伙伴，未来有望推广至更广泛的用户群体。 ---

AI项目与工具 2025年06月12日 30 点赞 0 评论 736 浏览

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。

Ai开源项目 2025年06月05日 90 点赞 0 评论 736 浏览

混元图生视频

混元图生视频是腾讯混元推出的开源图生视频模型，支持用户上传图片并输入描述生成5秒短视频，具备对口型、动作驱动和背景音效自动生成等功能。模型适用于多种风格与场景，参数量达130亿，已在腾讯云上线并开源，支持本地部署与定制开发，适用于创意视频、特效制作及动画开发等多个领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 737 浏览

Voice

Voice-Pro是一款开源的多功能音频处理工具，集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等功能，支持超过100种语言，广泛应用于教育、娱乐和商业领域，显著提升音频处理效率和便捷性。

AI项目与工具 2025年06月12日 33 点赞 0 评论 738 浏览

Banger

Banger是一款基于AI技术的音乐创作工具，支持用户对现有歌曲进行翻唱创作。它提供无缝人声替换、丰富语音库、个性化设置等功能，适用于个人创作、音乐教学、社交媒体分享等多种场景。用户可选择内置模板或上传原声，生成高质量翻唱作品并进行分享。Banger简化了音乐制作流程，降低了创作门槛，适合各类音乐爱好者和创作者使用。

AI项目与工具 2025年06月12日 51 点赞 0 评论 741 浏览

Gemini

Gemini是Google DeepMind推出的全新AI模型，集成了多模态推理功能，超越了以往模型的性能，适用于科学文献洞察、竞争性编程等多种应用场景。

Ai平台模型 2025年06月05日 100 点赞 0 评论 742 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期