音频 - 智狐AI导航

T2A

T2A-01-HD是一款支持声音克隆与多语言合成的AI语音模型，可精准还原原声特征与情感表达。具备智能情感系统、多语言支持及高级参数控制功能，适用于有声读物、影视配音、教育、语言学习等多种场景，提供高质量、个性化的语音输出。

AI项目与工具 2025年06月12日 46 点赞 0 评论 482 浏览

JoyGen

JoyGen是由京东科技与香港大学联合开发的音频驱动型3D说话人脸视频生成框架，能够实现唇部动作与音频信号的精准同步，并提供高质量的视觉效果。该工具采用单步UNet架构进行高效视频编辑，基于130小时中文视频数据集训练，在唇音同步和视觉质量方面表现优异。适用于虚拟主播、动画制作、在线教育及多语言视频生成等多个领域，为视频内容创作提供了创新解决方案。

AI项目与工具 2025年06月12日 78 点赞 0 评论 483 浏览

OnlineConvertFree

OnlineConvertFree，能转换各种文件、视频、音频和图片格式的在线免费转换软件。

格式转换 2025年06月05日 95 点赞 0 评论 484 浏览

Text To Speech

构建自然说话的应用和服务，从 147 种语言和变体中选择 456 种语音

创作工具 2026年06月21日 0 点赞 0 评论 484 浏览

detangle

detangle 是一款基于人工智能的法律辅助工具，能够快速生成法律文件摘要，将复杂术语转化为通俗语言，帮助用户精准识别关键条款并提供音频摘要功能。适用于个人、企业、法律从业者及学习者，提升法律文件处理效率与理解能力，同时保障数据安全。

AI项目与工具 2025年06月12日 53 点赞 0 评论 485 浏览

Natural Language Playlist

Natural Language Playlist 探索语言和音乐之间丰富而复杂的关系，并使用 Transformer 语言模型构建播放列表。由于没有更好的术语，音乐推荐是一种“闭门造车”的东西。

创作工具 2026年06月21日 0 点赞 0 评论 486 浏览

Cassette

Cassette能帮助您立即创作出高品质的节拍。凭借其先进的AI技术，Cassette可以生成与您的音乐视觉相匹配的独特节拍和节奏。只要向人工智能模型描述你的节拍，应用程序就会完成剩...

创作工具 2026年06月21日 0 点赞 0 评论 488 浏览

Hertz

Hertz-Dev是一款由Standard Intelligence开发的开源音频模型，专注于低延迟实时对话AI。它具备强大的音频生成与处理能力，能够处理和生成高质量的音频信号，并支持多任务微调，适用于语音识别、语音合成等多种应用场景。此外，Hertz-Dev还提供了音频自动编码、流式生成等功能，广泛应用于智能助手、客户服务、语音识别及合成等领域。

AI项目与工具 2025年06月12日 48 点赞 0 评论 489 浏览

iMyFone MusicAI

人工智能音乐生成器：轻松制作翻唱歌曲

创作工具 2026年06月21日 0 点赞 0 评论 489 浏览

Nooka

Nooka是一款基于AI技术的听书应用，提供全球非虚构类书籍的20分钟音频摘要，适合碎片化时间学习。用户可随时提问并获得AI即时回答，实现深度互动。应用支持多语言字幕、音频剪辑分享及社区交流，适用于通勤、运动、家务等多种场景，提升学习效率与趣味性。

AI项目与工具 2025年06月11日 16 点赞 0 评论 490 浏览

音频

首页

音频

列表

默认

浏览次数

发布日期

T2A