虚拟

Character

Character-3 是 Hedra Studio 推出的全模态 AI 视频生成工具,支持图像、文本和音频输入,生成高质量动态视频。具备全身动作捕捉、情感控制、精准对口型等功能,适用于创意视频、虚拟形象、教育、营销等多个场景。采用多模态融合与先进 AI 技术,提升视频自然度与连贯性,提高内容创作效率。

OmniBooth

OmniBooth是一款由华为诺亚方舟实验室与香港科技大学联合开发的图像生成框架,支持基于文本或图像的多模态指令控制及实例级定制。它通过高维潜在控制信号实现对图像中对象位置和属性的精准操控,具备多模态嵌入提取、空间变形技术以及特征对齐网络等功能,广泛应用于数据集生成、内容创作、游戏开发、虚拟现实及广告营销等领域。

ImageBind

ImageBind是由Meta公司开发的开源多模态AI模型,能够整合文本、音频、视觉、温度和运动数据等多种模态的信息,并将其统一到一个嵌入空间中。该模型通过图像模态实现其他模态数据的隐式对齐,支持跨模态检索和零样本学习。它在增强现实(AR)、虚拟现实(VR)、内容推荐系统、自动标注和元数据生成等领域有广泛应用。

小冰岛

小冰岛是一个独特的人工智能实验平台,提供了一个虚拟岛屿环境,让用户可以与 AI beings 共同生活、游玩和建设。

Joyland

Joyland 是一款支持 AI 角色创建与互动的平台,用户可自定义角色外观、性格与背景,构建文本冒险世界并与 AI 进行深度对话。该工具适用于创意写作、虚拟社交、情感陪伴、语言学习等多个场景,提供沉浸式体验与个性化内容生成功能,助力用户探索 AI 在叙事与互动中的潜力。

怪兽AI数字人

怪兽AI数字人为怪兽智能科技推出的产品,包含全息交互数字人、3D超写实交互数字人,AIGC生产、SaaS短视频创作管理和直播服务平台。

ObjectMover

ObjectMover是由香港大学与Adobe Research联合开发的图像编辑模型,专注于解决物体移动、插入和移除过程中的光影协调问题。通过视频先验迁移和序列到序列建模技术,实现对光照、阴影和遮挡关系的精准控制。支持多任务学习,提升模型在真实场景中的适应性。广泛应用于特效制作、虚拟场景编辑、游戏开发等领域,具备高效、真实的图像编辑能力。

DressPlay

DressPlay是一款基于AI技术的虚拟试衣应用,支持用户通过上传照片或视频实现服装的虚拟试穿。其核心功能包括虚拟试衣、服装选择、视频换装及个性化调整等。凭借强大的AI算法,DressPlay能精准分析用户身形并生成逼真效果,广泛应用于个人购物、电商平台、内容创作及设计等领域,提升用户体验与商家效率。

Chinese

Chinese-LiPS是由智源研究院与南开大学联合开发的高质量中文多模态语音识别数据集,包含100小时语音、视频及手动转录文本。其创新性融合唇读视频与幻灯片内容,显著提升语音识别性能,实验表明可降低字符错误率约35%。适用于教学、科普、虚拟讲解等复杂语境,为多模态语音识别研究提供丰富数据支持。

Anime gf

一个本地且开源的CharacterAI替代工具,提供了一个用户友好的界面,允许用户在桌面上与虚拟角色互动。你可以自定义创建各种角色,让每个虚拟角色都有自己的独特个性和语言风格。