Make-A-Character 创新的3D角色生成框架,它通过文本描述快速创建逼真的3D角色,具有高度的定制性和逼真度。它结合了最新的人工智能技术,提供了一个直观、灵活且高效的角色创建解决方案,适用于多... Ai平台模型 2026年06月21日 0 点赞 0 评论 862 浏览
VideoChat VideoChat是一款开源的实时数字人对话系统,支持语音输入与实时对话功能。用户可自定义数字人形象与音色,实现音色克隆。系统集成多种技术,包括语音识别、大语言模型生成及文本转语音,支持流式视频输出,适用于客户服务、在线教育、新闻播报、直播互动及娱乐等多个领域。 AI项目与工具 2025年06月12日 35 点赞 0 评论 880 浏览
魔珐科技 魔珐科技致力于为三维虚拟内容制作提供智能化、工业化的基础设施;为虚拟世界提供造人、育人、用人的全栈式技术和产品服务,打造虚拟世界基础设施平台。 AI服务商 2025年06月05日 10 点赞 0 评论 881 浏览
AI Chat AI Chat-avatar 是一款基于AI的数字人交互工具,支持多语言实时翻译与自然对话,适用于销售、客服、培训等多种场景。它能动态展示多媒体内容,提升信息理解度,并提供数据分析报告以优化沟通策略。用户可通过低代码方式快速定制虚拟形象,满足不同业务需求。 AI项目与工具 2025年06月12日 40 点赞 0 评论 893 浏览
JoyVASA JoyVASA是一个基于扩散模型的音频驱动数字人头项目,能够生成与音频同步的面部动态和头部运动。其主要功能包括唇形同步、表情控制及动物面部动画生成,支持多语言和跨物种动画化。项目采用两阶段训练方法,结合解耦面部表示与扩散模型技术,生成高质量动画视频,广泛应用于虚拟助手、娱乐媒体、教育、广告等多个领域。 AI项目与工具 2025年06月12日 17 点赞 0 评论 897 浏览
PersonaTalk PersonaTalk是一种基于注意力机制的两阶段框架,用于实现高保真度和个性化的视觉配音。其核心技术包括风格感知音频编码、唇形同步几何生成、双注意力面部渲染等,能够确保视频中人物的嘴型动作与输入音频精准匹配,同时保留说话者的独特风格和面部特征。相比现有技术,PersonaTalk在视觉质量和唇形同步方面表现更优,适用于电影、游戏、虚拟助手等多个领域。 AI项目与工具 2025年06月12日 72 点赞 0 评论 902 浏览
EchoMimic EchoMimic是一款由阿里蚂蚁集团开发的AI数字人开源项目,通过深度学习模型结合音频和面部标志点,创造出高度逼真的动态肖像视频。该工具支持音频同步动画、面部特征融合、多模态学习和跨语言能力,适用于娱乐、教育和虚拟现实等领域。其独特的技术原理包括音频特征提取、面部标志点定位、面部动画生成和多模态学习,使用了卷积神经网络(CNN)、循环神经网络(RNN)和生成对抗网络(GAN)等深度学习模型,实现 AI项目与工具 2025年06月12日 79 点赞 0 评论 934 浏览
小云雀APP 剪映推出的一款视频和图片创作工具,它能通过简单的指令快速生成短视频、数字人口播视频、设计图和换背景图,具备智能成片、数字人视频、AI设计和AI换背景四大功能。 视频剪辑 2025年06月05日 11 点赞 0 评论 1819 浏览