数字人 - 智狐AI导航

Phantom

Phantom是由字节跳动研发的视频生成框架，支持从参考图像中提取主体并生成符合文本描述的视频内容。它采用跨模态对齐技术，结合文本和图像提示，实现高质量、主体一致的视频生成。支持多主体交互、身份保留等功能，适用于虚拟试穿、数字人生成、广告制作等多种场景。模型基于文本-图像-视频三元组数据训练，具备强大的跨模态理解和生成能力。

AI项目与工具 2025年06月12日 72 点赞 0 评论 677 浏览

优雅YOYA

优雅（YOYA）是中科闻歌推出的多模态文生视频平台，基于大语言模型和多模态技术，支持从脚本生成到视频剪辑的全流程自动化。用户仅需输入主题，即可快速生成高质量视频，并支持语音克隆、口型翻译、数字人等功能。平台还具备多模态素材智能剪辑能力，提升创作效率与可控性，适用于媒体、影视、企业宣传及教育等领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 759 浏览

FantasyID

FantasyID是由阿里巴巴集团与北京邮电大学联合开发的视频生成框架，基于扩散变换器和3D面部几何先验，实现高质量、身份一致的视频生成。其通过多视角增强和分层特征注入技术，提升面部动态表现，同时保持身份稳定性。支持多种应用场景，如虚拟形象、内容创作和数字人交互，具备无需微调的高效生成能力。

AI项目与工具 2025年06月12日 81 点赞 0 评论 568 浏览

Avat3r

Avat3r 是由慕尼黑工业大学与 Meta Reality Labs 联合开发的高保真三维头部头像生成模型，基于高斯重建技术，仅需少量输入图像即可生成高质量且可动画化的 3D 头像。其核心优势在于使用交叉注意力机制实现表情动态化，支持多源输入，具备良好的鲁棒性和泛化能力。适用于 VR/AR、影视制作、游戏开发及数字人等领域。

AI项目与工具 2025年06月12日 69 点赞 0 评论 657 浏览

Character

Character-3 是 Hedra Studio 推出的全模态 AI 视频生成工具，支持图像、文本和音频输入，生成高质量动态视频。具备全身动作捕捉、情感控制、精准对口型等功能，适用于创意视频、虚拟形象、教育、营销等多个场景。采用多模态融合与先进 AI 技术，提升视频自然度与连贯性，提高内容创作效率。

AI项目与工具 2025年06月12日 66 点赞 0 评论 528 浏览

Heygem

Heygem是一款由硅基智能推出的开源数字人模型，支持Windows系统。它可通过1秒视频或照片快速生成数字人形象和声音，30秒内完成克隆，60秒合成4K视频。具备多语言支持、100%口型匹配、低配置运行等优势，适用于内容创作、教育、直播、影视及客服等多个领域，提供高效、低成本的数字人解决方案。

AI项目与工具 2025年06月12日 18 点赞 0 评论 844 浏览

15个AI数字人制作工具，快速生成口播和直播视频

AI数字人通过AI技术模拟真人外貌与行为，实现自然对话与情感表达。本文介绍多款数字人制作工具，支持视频创作、营销推广、教育培训等场景，功能包括3D内容生成、自定义编辑、后期包装等，适用于个人及企业用户，助力内容生产效率提升。

AI项目与工具 2025年06月12日 21 点赞 0 评论 649 浏览

TaoAvatar

TaoAvatar是阿里巴巴推出的高保真、轻量级3D全身虚拟人技术，基于3D高斯溅射（3DGS）实现照片级真实感的虚拟形象生成。支持多模态驱动，具备高帧率实时渲染能力，适用于AR、移动设备及高清显示平台。其轻量级架构结合深度学习优化，提升了运行效率与交互自然度，广泛应用于电商直播、全息通信、虚拟会议、在线教育及娱乐等领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 726 浏览

Vace AI

Vace AI 是一款集成视频生成与编辑功能的 AI 工具，支持文本到视频、参考图像生成视频等功能，并提供风格转换、主体移除、画面扩展等编辑选项。基于先进模型技术，可精准保留关键视觉元素，生成高质量视频，适用于短视频制作、创意内容生成及广告设计等多种场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 673 浏览

MoCha

MoCha 是一款由 Meta 与滑铁卢大学联合开发的端到端对话角色视频生成模型，支持语音与文本驱动的角色动画生成，具备全身动作模拟与多角色对话交互能力。其核心技术包括扩散变压器架构和语音-视频窗口注意力机制，确保动画与语音精准同步。适用于虚拟主播、影视动画、教育内容及数字人客服等多个领域，提升了内容创作效率与表现力。

AI项目与工具 2025年06月12日 34 点赞 0 评论 733 浏览

数字人

首页

数字人

列表

默认

浏览次数

发布日期