生成

roomGPT

RoomGPT是一款基于AI技术的室内设计工具,用户上传房间照片后,可在几秒内生成多种设计方案,涵盖不同主题、色彩搭配及家具布局。它还提供成本估算功能,帮助用户在保持预算可控的前提下实现理想的设计效果,广泛适用于个人住宅、商业空间、房地产营销及教育领域。

Predis AI

一款人工智能驱动的社交媒体营销工具,旨在帮助企业创建引人入胜的视频和图像内容并获得强大的内容分析。

LDGen

LDGen是一款结合大型语言模型与扩散模型的文本到图像生成工具,支持零样本多语言生成,提升图像质量和语义一致性。通过分层字幕优化、LLM对齐模块和跨模态精炼器,实现文本与图像的高效交互。实验表明其性能优于现有方法,适用于艺术创作、广告设计、影视制作等多个领域,具备高效、灵活和高质量的生成能力。

Cherry Studio

Cherry Studio 是一款支持多平台的 AI 工具客户端,集成主流云模型与本地模型运行功能,允许用户自由切换并对比不同模型输出。内置 300 多个预设 AI 助手,涵盖写作、编程、设计等领域,支持自定义配置。支持多种文件格式处理、代码高亮、图表可视化及数据备份,适用于文本创作、代码生成、数据分析等场景。

VARGPT

VARGPT是一款多模态大语言模型,整合了视觉理解和生成任务于统一的自回归框架中。它通过next-token和next-scale预测机制,支持文本与图像的混合输入和输出,具备高效的视觉生成能力。模型采用三阶段训练策略,提升了在视觉问答、推理及图像生成任务中的表现。适用于多模态内容创作、指令到图像合成等场景。

PhysGen3D

PhysGen3D 是一款能够将单张图像转换为交互式 3D 场景并生成物理真实视频的工具。它结合图像分析与物理模拟技术,支持精确控制物体属性、动态效果整合及高质量渲染。适用于影视、VR/AR、教育、游戏和广告等多个领域,提供高效且逼真的视觉内容生成能力。

Infinite Mobility

Infinite Mobility是由上海AI Lab开发的交互式物体生成模型,基于程序化技术快速生成高质量、多样化的可交互物体,支持22类常见物体,单次生成仅需1秒,成本低至0.01元。其生成的物体广泛应用于机器人仿真、医疗设备开发、家庭服务机器人等领域,提升虚拟训练的真实性和效率。

LongRAG

LongRAG是一个专为长文本问答设计的双视角鲁棒检索增强生成框架,包含混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM增强生成器。它通过整合全局上下文与细节信息,解决长文本中的复杂问答挑战,并在多个数据集上展现优异性能。此外,其自动化微调数据构建能力增强了模型的指令遵循能力和领域适用性。

Snapcut

Snapcut是一款基于人工智能技术的视频编辑工具,能够将长视频自动剪辑为适配社交媒体的短视频。它支持多种视频格式和语言字幕,具备一键生成、智能分析、画面重组和字幕生成等核心功能,广泛应用于教育、营销、娱乐等多个领域,帮助用户高效完成视频内容创作。