数字

AIGCPanel

AIGCPanel是一款开源的AI数字人系统,支持视频合成、声音合成与声音克隆等功能。它利用自然语言处理、计算机视觉技术和深度学习算法,实现高质量的音视频同步和自然语音生成。系统具有多语言支持、模型管理和日志查看功能,可应用于影视制作、虚拟主播、教育培训等多个领域。

VersaGen

VersaGen是一款基于生成式AI的文本到图像合成工具,支持多样化视觉控制和灵活的创意表达。通过适配器训练和优化策略,VersaGen将视觉信息融入生成过程中,显著提升了图像质量和用户体验。该工具适用于创意设计、数字艺术、广告营销、游戏开发及影视制作等多个领域,为用户提供了高效且直观的视觉创作解决方案。

StereoCrafter

StereoCrafter是一款由腾讯AI Lab与ARC Lab联合开发的创新性工具,可将传统2D视频转化为高质量的立体3D视频。它采用深度估计、视频变形及立体视频修复等关键技术,确保生成的3D视频具备高保真度和一致性。该工具广泛应用于影视制作、虚拟现实(VR)、增强现实(AR)、游戏开发等领域,为用户提供更加沉浸式的视觉体验。

MuseGate

MuseGate是一款依托生成式AI技术的电商营销工具,专注于服饰行业。它通过虚拟模特生成、场景定制、尺寸调整等功能,助力企业优化商品展示效果,降低运营成本,提升品牌形象。其核心功能包括虚拟模特生成、一键换装、场景定制、节点营销等,广泛应用于时尚展示、电子商务、广告宣传等领域。

11x

11X是一款基于AI技术打造的数字员工服务平台,主要功能涵盖自动化销售流程、跨渠道客户互动以及多语言支持等。其核心产品Alice和Mike分别负责潜在客户挖掘与沟通安排、电话销售与客户跟进,助力企业实现高效运营。平台支持25种语言,适用于多种业务场景,包括销售自动化、客户服务、市场推广及语言翻译等。

Lookie

Lookie是一款基于AI技术的穿搭应用,用户可上传照片创建数字分身,试穿各类潮流服饰,并获取穿搭建议。它拥有丰富的服饰库,支持场景模拟及电商跳转功能,旨在提升用户日常与特殊场合的穿搭体验。

DisPose

DisPose是一项由多家顶尖高校联合研发的技术,专注于优化人物图像动画的质量。它通过运动场引导和关键点对应的方式,结合混合ControlNet模块,实现了对骨骼姿态的有效控制,无需额外密集输入即可生成高质量、一致性的动画视频。DisPose广泛适用于艺术创作、社交媒体、数字人制作及虚拟现实等领域。

CLEAR

CLEAR是一种由新加坡国立大学推出的新型线性注意力机制,能够有效提升预训练扩散变换器生成高分辨率图像的效率。该机制通过局部注意力窗口和知识蒸馏技术,实现了线性复杂度,显著减少了计算量和时间延迟,同时保持了高质量的图像生成效果。CLEAR还支持跨模型泛化、多GPU并行推理以及稀疏注意力优化,广泛适用于数字媒体创作、虚拟现实、游戏开发等多个领域。

Remento

Remento是一款将口头回忆转化为个性化纪念册的服务,基于Speech-To-Story™技术,将录音转写为书面故事并制成精美书籍。用户可通过提示或上传照片激发记忆,从任何设备轻松录制回答,支持文字编辑与定制化处理,同时保留原始录音的QR码链接。主要应用于家族历史记录、老年人生活回忆、节日庆典、教育传承及个人生命故事记录等领域。

Pika 2.0

Pika 2.0是一款由Pika Labs开发的AI视频生成工具,具备强大的文本对齐、动作渲染及场景元素整合功能。它能将详细提示转化为连贯且富有想象力的视频剪辑,同时提供自然的动作效果和可信的奇幻物理表现。此外,Pika 2.0支持用户上传和定制化场景元素,通过先进的图像识别技术实现无缝集成,为创作者提供更精细的控制权。这款工具适用于媒体娱乐、电商、教育、工业、医疗和个人创作等多个领域。