音频 - 智狐AI导航

Buzz

Buzz是一款基于OpenAI Whisper模型的离线语音转文字工具，支持实时语音转文字和音频视频文件转录。它具备多语言识别和翻译功能，支持多种格式导出，并能在本地离线操作以保护用户隐私。主要应用于视频字幕制作、采访记录整理、语言学习辅助、会议记录和学术研究等场景。

AI项目与工具 2025年06月12日 10 点赞 0 评论 502 浏览

Coco视频解析下载

Coco视频解析下载功能多样，支持单个视频提取、视频主页提取、多链接批量提取、提取音频等，全网视频解析下载可以解析各种视频网站上的视频。

格式转换 2025年06月05日 100 点赞 0 评论 505 浏览

ReadSpeaker

ReadSpeaker 提供了一系列强大的文本转语音解决方案，可在任何环境中即时部署逼真、定制的语音交互。

创作工具 2026年06月21日 0 点赞 0 评论 505 浏览

EMO2

EMO2是一种由阿里巴巴智能计算研究院开发的音频驱动头像视频生成技术，通过音频输入和静态人像照片生成高质量、富有表现力的动态视频。其核心技术包括音频与手部动作的协同建模、扩散模型生成视频帧，以及高精度音频同步。该工具支持多样化动作生成，适用于虚拟现实、动画制作和跨语言内容创作等场景，具备自然流畅的视觉效果和丰富的应用场景。

AI项目与工具 2025年06月12日 62 点赞 0 评论 507 浏览