语音 - 智狐AI导航

DreamActor

DreamActor-M1是字节跳动推出的AI图像动画框架，能够将静态照片转化为高质量动态视频。其核心在于混合引导机制，结合隐式面部表示、3D头球和身体骨架，实现对表情和动作的精准控制。支持多语言语音驱动、口型同步、灵活运动转移及多样化风格适配，适用于虚拟角色创作、个性化动画生成、虚拟主播制作及创意广告等领域，具备高保真、强连贯性和广泛适用性。

AI项目与工具 2025年06月12日 86 点赞 0 评论 793 浏览

蓝心大模型

蓝心大模型是由vivo研发的通用大模型矩阵，包括语言、端侧、语音、图像及多模态模型。该模型在内容创作、知识问答、逻辑推理、代码生成、信息提取、多语言翻译等方面表现出色。蓝心端侧大模型3B在移动设备上表现出色，蓝心语音大模型支持多语言，蓝心图像大模型融合了中国特色和东方美学，蓝心多模态大模型则提供了流畅的视频对话体验。

AI项目与工具 2025年06月12日 76 点赞 0 评论 793 浏览

Fliki.ai

将文本变成带有 AI 语音的视频,在 2 分钟内使用逼真的声音从脚本或博客文章创建视频！

创作工具 2026年06月21日 0 点赞 0 评论 793 浏览

字幕酱

字幕酱是一个在线字幕生成工具，利用 AI 深度学习技术，提供自动字幕生成、字幕翻译、字幕格式转换等功能。

字幕配音 2025年06月05日 35 点赞 0 评论 791 浏览

FunASR

FunASR是一个由阿里巴巴达摩院开源的多功能语音识别工具包，涵盖语音识别（ASR）、语音活动检测（VAD）、标点恢复、说话人验证及分离等功能。它支持工业级模型的训练与微调，并提供预训练模型和易用接口，便于快速部署。新增的Whisper-large-v3-turbo模型进一步提升了其性能，广泛应用于智能助手、会议记录、客服系统和语音搜索等领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 791 浏览

Amphion

Amphion是一款开源音频生成工具包，包含文本转语音（TTS）、歌声合成（SVS）、语音转换（VC）、歌声转换（SVC）、文本转音频（TTA）和文本转音乐（TTM）等功能。它支持多种神经声码器，并提供可视化模型架构，帮助用户快速掌握音频生成技术。通过统一框架和预训练模型，Amphion推动了音频生成领域的研究和应用发展。

AI项目与工具 2025年06月12日 63 点赞 0 评论 790 浏览

Avatar IV

Avatar IV 是 HeyGen 推出的 AI 数字人模型，支持用户通过上传照片和语音快速生成逼真视频。该工具基于音频驱动的表情引擎，能精准捕捉语音中的语调、节奏和情感，生成自然流畅的面部表情和动作。操作简单，无需专业技能，适用于多种角色形象，涵盖社交媒体、企业营销、在线教育等多个领域，是高效内容创作的理想选择。

AI项目与工具 2025年06月11日 45 点赞 0 评论 790 浏览

小饿

小饿是饿了么推出的AI语音助手，专为外卖骑手设计，支持语音交互完成接单、确认到店等操作，提升配送效率。具备权益提醒、天气预警、路线提示、订单热力图及收入预估等功能，覆盖多种配送场景，增强用户体验。已在多个城市上线，适用于蜂鸟众包APP用户。

AI项目与工具 2025年06月11日 12 点赞 0 评论 789 浏览

BANTER AI

BanterAI 是一款基于人工智能技术的创新平台，允许用户与名人、专家及历史人物的虚拟化身进行实时语音对话。其核心功能包括AI克隆体创建、个性化定制、实时互动、数据分析及快速响应，广泛应用于粉丝互动、内容创作、品牌推广、教育培训及娱乐体验等领域。

AI项目与工具 2025年06月12日 25 点赞 0 评论 789 浏览

睿声Reecho

一款专注于5秒瞬时语音克隆和超拟真语音合成的AI语音克隆平台。

Ai语音工具 2025年06月05日 83 点赞 0 评论 789 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期