虚拟

Sitcom

Sitcom-Crafter是一款由多所高校联合开发的3D场景人类动作生成系统,能够根据剧情描述生成多样化、符合物理规律的动作,包括行走、交互及多人协作。系统具备八大模块,包含核心动作生成与增强功能,如碰撞修正、运动同步与手部姿态检索。其核心技术包括3D场景感知与自监督SDF策略,无需额外数据即可生成自然动作。适用于动画、游戏、VR/AR、影视及教育等多个领域,提升创作效率与智能化水平。

Glow

GLOW 是一个创新的AI虚拟社交应用,它通过提供个性化的智能体和沉浸式的交流体验,使用户能够与AI建立情感联系,享受不间断的社交互动。

MVGenMaster

MVGenMaster是一款基于多视图扩散模型的工具,利用增强的3D先验技术实现新视角合成任务。它可以从单一图像生成多达100个新视图,具有高度的灵活性和泛化能力。模型结合了度量深度、相机姿态扭曲以及全注意力机制等技术,支持高效的前向传播过程,同时兼容大规模数据集。MVGenMaster在视频游戏、电影特效、虚拟现实、3D建模及建筑可视化等领域具有广泛应用前景。

抖音AI分身

抖音AI分身是一款基于豆包大模型算法的AI虚拟分身工具,支持创作者创建与自身风格相似的虚拟形象,用于全天候互动交流。其功能包括AI互动空间、AI群聊、AI私信、AI评论和AI直播,广泛应用于虚拟直播、互动娱乐、内容创作、品牌营销及教育培训等领域,助力创作者高效运营并提升用户体验。

RAG

RAG-Diffusion是一种区域感知型文本到图像生成工具,采用区域硬绑定与区域软细化两阶段策略,实现对图像区域的精确控制与细节优化。该工具支持图像重绘,无需额外内绘模型,且具备免微调特性。其主要应用场景包括数字艺术创作、广告设计、游戏开发及影视制作等领域,能够显著提升工作效率并满足个性化需求。

GenXD

GenXD是一款由新加坡国立大学与微软联合开发的3D-4D联合生成框架,能够从任意数量的条件图像生成高质量的3D和4D场景。它通过数据整理流程提取相机姿态和物体运动信息,基于多视角时序模块分离相机与物体运动,并借助掩码潜在条件支持多种视角生成。GenXD支持3D场景重建、动态场景生成以及3D和4D数据融合,适用于视频游戏开发、电影制作、虚拟现实、建筑规划等多个领域。

VidAU

VidAU提供了一个基于人工智能的视频生成服务,旨在简化从构思到制作的整个内容创作过程,让创作变得更加容易。

DeepMesh

DeepMesh是由清华大学和南洋理工大学研发的3D网格生成框架,结合强化学习与自回归变换器技术,实现高质量、高精度的3D模型生成。支持点云和图像条件输入,具备高效的预训练策略与人类偏好对齐机制,适用于虚拟环境、角色动画、医学模拟及工业设计等多个领域。

Genmoji

Genmoji是一款AI驱动的表情包生成工具,支持文字生成、人脸生成及搜索表情三大功能,通过多样化的内容满足用户的个性化需求。它可与WhatsApp、iMessage等社交应用无缝衔接,增强聊天体验,同时适用于教育、营销等多种场景,兼具实用性和娱乐性。

EMO2

EMO2是一种由阿里巴巴智能计算研究院开发的音频驱动头像视频生成技术,通过音频输入和静态人像照片生成高质量、富有表现力的动态视频。其核心技术包括音频与手部动作的协同建模、扩散模型生成视频帧,以及高精度音频同步。该工具支持多样化动作生成,适用于虚拟现实、动画制作和跨语言内容创作等场景,具备自然流畅的视觉效果和丰富的应用场景。