音频 - 智狐AI导航

OpenMusic

OpenMusic是一款基于QA-MDT技术的文生音乐工具，支持从文本生成高质量音乐作品，具备质量感知训练、多样化风格生成及复杂推理能力。它广泛应用于音乐制作、多媒体内容创作、音乐教育等领域，同时提供音频编辑与处理功能，旨在提升音乐创作效率和质量。

AI项目与工具 2025年06月12日 87 点赞 0 评论 745 浏览

SynthID

SynthID是一款由DeepMind研发的技术工具，通过在AI生成的内容中嵌入数字水印来验证其真实性与原创性。它支持多种内容形式，包括文本、音乐、图像和视频，并具备良好的抗修改性和检测稳定性。SynthID不仅不影响内容质量，还提升了信息可信度，广泛应用于新闻、版权保护、教育、法律及社交媒体等领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 743 浏览

TME Studio腾讯音乐

分析TME全曲库歌词以及散文、诗歌等多种语料素材，依据智能推荐算法帮你找到合适的押韵词语，打开灵感空间

创作工具 2026年06月21日 0 点赞 0 评论 743 浏览

Liner.ai

Liner.ai 是一款面向非专业程序员和数据科学家的机器学习工具，通过简单的点击操作即可训练模型，无需编写代码。该工具提供多种项目模板，涵盖图像、文本、音频和视频分类，以及对象检测和图像分割等任务。Liner.ai 支持在 CPU 上快速训练模型，并可在本地完成训练以保护数据隐私。此外，该工具还允许用户轻松地将模型导出到多个平台，适合初学者和专业人士使用。

AI项目与工具 2025年06月12日 96 点赞 0 评论 743 浏览

Gemini

Gemini是Google DeepMind推出的全新AI模型，集成了多模态推理功能，超越了以往模型的性能，适用于科学文献洞察、竞争性编程等多种应用场景。

Ai平台模型 2025年06月05日 100 点赞 0 评论 741 浏览

Banger

Banger是一款基于AI技术的音乐创作工具，支持用户对现有歌曲进行翻唱创作。它提供无缝人声替换、丰富语音库、个性化设置等功能，适用于个人创作、音乐教学、社交媒体分享等多种场景。用户可选择内置模板或上传原声，生成高质量翻唱作品并进行分享。Banger简化了音乐制作流程，降低了创作门槛，适合各类音乐爱好者和创作者使用。

AI项目与工具 2025年06月12日 51 点赞 0 评论 741 浏览

Voice

Voice-Pro是一款开源的多功能音频处理工具，集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等功能，支持超过100种语言，广泛应用于教育、娱乐和商业领域，显著提升音频处理效率和便捷性。

AI项目与工具 2025年06月12日 33 点赞 0 评论 738 浏览

混元图生视频

混元图生视频是腾讯混元推出的开源图生视频模型，支持用户上传图片并输入描述生成5秒短视频，具备对口型、动作驱动和背景音效自动生成等功能。模型适用于多种风格与场景，参数量达130亿，已在腾讯云上线并开源，支持本地部署与定制开发，适用于创意视频、特效制作及动画开发等多个领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 736 浏览

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。

Ai开源项目 2025年06月05日 90 点赞 0 评论 736 浏览

Movie Gen

Movie Gen是Meta开发的一款AI视频生成与编辑工具，支持根据文本提示生成高清视频并提供同步音频配制。该工具具备强大的视频生成能力，可创建长达16秒的高清视频，并支持照片定制化视频生成和精准编辑功能。此外，它还拥有先进的音频生成技术，能够生成高质量的环境音效和背景音乐。当前，Movie Gen主要服务于Meta内部团队及部分合作伙伴，未来有望推广至更广泛的用户群体。 ---

AI项目与工具 2025年06月12日 30 点赞 0 评论 735 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期