场景

TextHarmony

TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型,擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术,支持视觉文本生成、编辑、理解及感知等功能,广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练,TextHarmony在视觉与语言生成任务中表现出色。

Jay创作

Jay 创作是一款专为电商卖家打造的 AI 商拍工具,帮助电商卖家解决传统商拍成本高、效率低的问题,包括智能商拍服装模特图、商品场景图、商品抠图以及定制模特等。

VirtuLook

wondershare VirtuLook,AI电商图片生成神器。

AnyDoor

Anydoor 提供了一个平台,让用户能够创造和体验个性化的 AI 世界。通过定制化的场景和交互设计,用户可以探索和享受独特的人工智能体验。

presti

Presti是一款基于生成式AI技术开发的家具行业产品摄影解决方案,能够将单一产品图像转化为逼真的生活场景照片,显著降低摄影成本并提高效率。它支持用户添加配饰、更换材质及背景生成,广泛应用于家具展示、虚拟摄影、室内设计和电子商务等领域。

图可丽抠图

图可丽抠图,专业的 AI 图像、视频处理工具,智能一键抠图、高清、修复、转卡通。

VideoDoodles

一款能在视频中轻松任意插入手绘动画并与视频内容无缝融合的AI工具,通过VideoDoodles你可以在视频中添加手绘涂擦动画,这些动画不仅能跟随视频中的物体移动,还能自动调整大小和角度。

多面AI面试

一款全自动AI面试评价系统,多面为企业提供招聘过程中对人才的管理、科学的甄别、AI提效的招聘需求。

CogVideo

目前最大的通用领域文本生成视频预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。

HoloTime

HoloTime 是由北京大学深圳研究生院与鹏城实验室联合开发的全景 4D 场景生成框架,可将单张全景图像转化为动态视频,并进一步重建为沉浸式 4D 场景。其核心技术包括全景动画生成器(Panoramic Animator)和时空重建技术,结合 360World 数据集进行训练,实现高质量的视频生成与场景重建。该工具支持 VR/AR 应用,适用于虚拟旅游、影视制作、游戏开发等多个领域,提供高效的沉