TANGO TANGO是一个开源框架,利用分层音频运动嵌入和扩散插值网络,生成与目标语音同步的全身手势视频。其主要功能包括高保真视频制作、跨模态对齐、过渡帧生成及外观一致性保持,适用于新闻播报、虚拟YouTuber、在线教育等多个领域。该工具通过先进的技术解决了动作与语音匹配问题,并有效提升了视频内容制作效率。 AI项目与工具 2025年06月12日 78 点赞 0 评论 425 浏览
HumanDiT HumanDiT是一种由浙江大学与字节跳动联合开发的高保真人体视频生成框架,基于扩散变换器(DiT)实现姿态引导的视频生成。它支持长序列、多分辨率视频生成,并通过关键点扩散变换器(Keypoint-DiT)确保动作的连贯性与自然性。引入前缀潜在参考策略以保持个性化特征,结合姿态适配器和细化模块提升细节质量。适用于虚拟人、动画制作、沉浸式体验及视频续写等多种场景。 AI项目与工具 2025年06月12日 41 点赞 0 评论 385 浏览
DICE DICE-Talk是由复旦大学与腾讯优图实验室联合开发的动态肖像生成框架,能够根据音频和参考图像生成具有情感表达的高质量视频。其核心在于情感与身份的解耦建模,结合情感关联增强和判别机制,确保生成内容的情感一致性与视觉质量。该工具支持多模态输入,具备良好的泛化能力和用户自定义功能,适用于数字人、影视制作、VR/AR、教育及心理健康等多个领域。 AI项目与工具 2025年06月11日 87 点赞 0 评论 348 浏览
Digen AI 一种利用AI技术创建的克隆数字人,Digen AI人物形象模拟、人物声音克隆、自然语言处理、知识图谱解析等众多世界领先的人工智能技术,使得Digen AI可以随时随地与真人进行准确交互性对话。 Ai视频生成 2025年06月05日 59 点赞 0 评论 344 浏览
Audio2Photoreal 从音频生成全身逼真的虚拟人物形象。它可以从多人对话中语音中生成与对话相对应的逼真面部表情、完整身体和手势动作。 Ai开源项目 2025年06月05日 77 点赞 0 评论 338 浏览
法小开 法小开依托强大的AI技术,通过平台化的服务矩阵,让互联网技术和大数据赋能法律服务,突破传统法律服务形式的边界线,为个人和企业提供多维度、高效能的综合法律解决方案。 AI服务商 2025年06月05日 49 点赞 0 评论 298 浏览
星火快答 星火快答是科大讯飞推出的AI智能交互系统,集成了虚拟人、语音识别、大数据分析等功能,适用于展厅、会议、营销等场景。支持多模态交互、知识问答、数据可视化与跨屏联动,提升信息传递效率与用户体验。 AI项目与工具 2025年06月12日 86 点赞 0 评论 294 浏览
Inworld Inworld是一家生成式 AI 数字人/虚拟角色开发公司,人工智能角色就像虚拟人一样,可以说话、行动和感受情感。它们可用于游戏、娱乐和客户服务。 3D&游戏 2025年06月05日 71 点赞 0 评论 285 浏览