图像

Pixel3DMM

Pixel3DMM是由慕尼黑工业大学、伦敦大学学院和Synthesia联合开发的单图像3D人脸重建框架,基于DINOv2模型,能从单张RGB图像中准确重建出3D人脸的几何结构。该工具擅长处理复杂表情和姿态,支持身份和表情的解耦,并通过FLAME模型优化实现高精度重建。其应用场景涵盖影视游戏、VR/AR、社交视频、医疗美容和学术研究。

百度网盘AI修图

百度网盘AI修图是一款基于AI技术的专业人像处理工具,提供包括AI美颜、智能美型、背景修复和衣物去皱等功能。它能够智能识别和处理面部瑕疵、背景褶皱及衣物折痕,使照片呈现更自然的效果。支持批量处理和预设模板,极大提升了修图效率,适用于个人用户、专业摄影师、影楼和广告行业等多种场景。

Cal AI

Cal AI是一款基于AI技术的营养分析工具,通过图像识别技术分析食物的卡路里和营养成分。它支持多样的输入方式,包括拍照、条形码扫描和手动输入,并允许用户修正AI分析结果以提升准确性。Cal AI可生成个性化的饮食计划,适用于体重管理、健康饮食、健身规划及特殊人群如孕妇、哺乳期女性和糖尿病患者的营养需求。

Word

我们的文字作为图像插图在不同的字体和不同的文本概念。使用我们的方法,语义调整的字母完全自动创建,然后可以用于进一步的创造性设计,正如我们在这里所演示的那样。

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型,基于 Qwen2.5-VL 架构,结合强化学习优化技术,具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析,支持自然语言指令定位图像目标,并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

Project Turntable

Project Turntable是一款由Adobe发布的AI工具,支持用户在三维空间中旋转二维矢量图像,并利用生成式AI和深度学习技术即时生成图像的隐藏部分。它显著提升了设计师的工作效率,减少了重复性劳动,适用于平面设计、插画创作、动画制作及游戏开发等领域,同时保持了图像的二维特性和平滑过渡效果。

OpenDream

Opendream.ai 是一个可让您在 AI 的帮助下创建令人惊叹的图像网站,您可以使用它在短短几秒钟内生成艺术、logo、设计等。

Mora

Mora是一个多智能体框架,专为视频生成任务设计,通过多个视觉智能体的协作实现高质量视频内容的生成。主要功能包括文本到视频生成、图像到视频生成、视频扩展与编辑、视频到视频编辑以及视频连接。尽管在处理大量物体运动场景时性能稍逊于Sora,Mora仍能在生成高分辨率视频方面表现出色。

Bright Eye

Bright Eye是一款多功能的AI分析图像,可以生成文本、图像、代码、故事、诗歌的APP程序。

Hi3DGen

Hi3DGen是由多所高校与企业联合开发的高保真3D几何生成框架,可从2D图像生成具有丰富细节的3D模型。其核心技术包括图像到法线估计、法线到几何学习及3D数据合成,采用两阶段生成流程并结合3D高斯散射与SDF重建技术,提升模型精度与细节表现。适用于游戏开发、影视制作、3D可视化等多个领域。