生成

GPT Pilot

GPT Pilot是一款AI编程工具,旨在通过模拟人类开发者的工作流程,帮助从零开始构建应用程序。它能够编写代码、调试程序、与用户讨论问题,并请求代码审查,是真正的AI开发者伙伴。GPT Pilot支持多种运行方式,包括VS Code扩展、命令行工具和Docker容器,使开发者能够在熟悉的环境中提升开发效率。其主要功能包括全功能代码生成、交互式问题解答、高度集成的开发环境、逐步开发、任务分配、开发

AIVA

AIVA是一款基于人工智能的音乐生成平台,支持快速生成超过250种风格的原创音乐。它具备高度定制化功能,可上传音频或MIDI文件作为参考,支持多格式下载,并提供灵活的版权解决方案。AIVA适用于视频配乐、游戏音效、社交媒体内容制作等多个应用场景,帮助用户高效创作高质量音乐作品。

Vozo AI

一款AI视频生成器,Vozo AI通过重新编写、重新配音、编辑声音,然后通过提示将现有视频配音成新的视频故事。用户可以轻松将视频转换为宣传片、喜剧或多语言版本。

FlashVideo

FlashVideo是由字节跳动团队研发的高分辨率视频生成框架,采用两阶段方法优化计算效率。第一阶段在低分辨率下生成高质量内容,第二阶段通过流匹配技术提升至1080p,仅需4次函数评估。其特点包括高效计算、细节增强、快速预览及多场景应用,适用于广告、影视、教育等领域。

PostNitro AI

适用于 Instagram、LinkedIn 等的免费AI轮播帖子生成器,PostNitro AI几分钟内就可生成可定制的、与品牌一致的内容,从而提升您的社交媒体参与度。

StickerBaker

一个基于AI文生图的AI贴纸创作工具,SickerBaker允许用户通过输入特定的提示语句快速生成各种Q版贴纸图。

Ruyi

Ruyi是一款基于DiT架构的图生视频大模型,支持多分辨率和多时长的视频生成,具有首帧、首尾帧控制、运动幅度调整及镜头方向控制等功能。它通过Casual VAE模块和Diffusion Transformer实现视频数据的压缩与生成,旨在降低动漫和游戏内容的开发周期和成本。目前,Ruyi-Mini-7B版本已开源。

Infinite Mobility

Infinite Mobility是由上海AI Lab开发的交互式物体生成模型,基于程序化技术快速生成高质量、多样化的可交互物体,支持22类常见物体,单次生成仅需1秒,成本低至0.01元。其生成的物体广泛应用于机器人仿真、医疗设备开发、家庭服务机器人等领域,提升虚拟训练的真实性和效率。

DynamicCity

DynamicCity是由上海AI Lab开发的大规模动态场景生成框架,支持高质量4D LiDAR场景的生成与重建,适用于自动驾驶、机器人导航、虚拟现实等多个领域。该框架基于VAE和DiT模型,实现高效的场景编码与生成,支持轨迹引导、指令驱动生成和动态修复等多种应用,展现出优异的性能和广泛的应用潜力。

MILS

MILS是由Meta AI开发的一种无需额外训练即可为大型语言模型(LLM)提供多模态能力的框架。它通过多步推理、评分反馈和迭代优化,实现图像、视频、音频等多模态内容的生成与理解。MILS支持零样本描述生成、风格迁移、跨模态推理等任务,适用于内容生成、多模态检索、视觉问答等多个场景,具备高效、灵活和无需训练的优势。