音频 - 智狐AI导航

Covers AI

一款功能强大的AI声音和歌曲生成器工具，允许用户使用来自著名主播、政治家、歌手、卡通人物等的数千种声音生成 AI 翻唱。

Ai语音工具 2025年06月05日 82 点赞 0 评论 638 浏览

Emote Portrait Alive

阿里巴巴发布的EMO，一种音频驱动的AI肖像视频生成框架。通过输入单一的参考图像和语音音频，Emote Portrait Alive可以生成动态的、表情丰富的肖像视频。

Ai开源项目 2025年06月05日 18 点赞 0 评论 637 浏览

MagicMic

MagicMic是一个功能强大的声音变换工具，适用于游戏玩家、主播和内容创作者。它通过提供丰富的声音过滤器和音效，以及实时声音变换技术，使用户能够在游戏中或在线聊天中保护隐私...

创作工具 2026年06月21日 0 点赞 0 评论 636 浏览

OmniHuman

OmniHuman是字节跳动推出的多模态人类视频生成框架，基于单张图像和运动信号生成高逼真视频。支持音频、姿势及组合驱动，适用于多种图像比例和风格。采用混合训练策略和扩散变换器架构，提升生成效果与稳定性，广泛应用于影视、游戏、教育、广告等领域。

AI项目与工具 2025年06月12日 43 点赞 0 评论 635 浏览

MimicTalk

MimicTalk是一款利用NeRF技术快速生成个性化3D说话人脸模型的工具，其核心功能包括15分钟内完成新身份训练、高质量视频生成、增强的表现力以及上下文学习能力。该工具通过混合适应流程、上下文风格化音频到运动模型等技术，实现了高效的数据样本利用和训练效率提升，适用于虚拟主播、远程协作、VR/AR等领域。

AI项目与工具 2025年06月12日 59 点赞 0 评论 634 浏览