生成

绘世启动器

绘世启动器是由B站UP主@秋葉aaaki开发的电脑桌面应用,旨在简化Stable Diffusion-WebUI项目的启动和管理。它支持一键启动、修复、更新、模型下载、模型管理和模型训练等功能,特别适合低配电脑和无编程基础的用户。启动器内置疑难解答系统,能够诊断并解决常见错误,同时支持部署SD-WebUI、ComfyUI等多种WebUI界面,便于用户构建完整的环境。

OmniManip

OmniManip是由北京大学与智元机器人联合实验室开发的通用机器人操作框架,结合视觉语言模型与三维操作技术,实现机器人在非结构化环境中的任务执行。其核心为以对象为中心的交互基元表示法,支持零样本泛化、跨平台部署及大规模仿真数据生成。通过双闭环系统设计与任务分解机制,提升操作精度与适应性,适用于日常操作、工业自动化及服务机器人等场景。

SoulGen

SoulGen是一款基于AI的艺术生成平台,支持文本到图像的转换、图像编辑、边界扩展及相似肖像生成等功能。它适用于个人艺术创作、角色设计、概念艺术、广告设计以及社交媒体内容制作等多个领域,提供灵活高效的创意解决方案。

Medeo

Medeo是一款基于AI技术的视频创作平台,能够将文字描述自动转化为高质量视频。它具备智能文生视频、素材匹配、AI配音、音乐推荐、URL转视频及动画生成等功能,广泛应用于内容创作、企业营销、教育培训、个人娱乐和新闻媒体等多个领域。平台集成了多种先进AI模型,提升视频制作效率与创意表现力,是创作者的理想工具。

Songburst

Songburst是一款基于AI技术的音乐生成工具,用户可通过描述音乐风格或情感来生成原创音轨。该工具支持多场景应用,包括视频、播客、游戏等,并可将音乐导出至Spotify和Apple Music等平台。用户能够无限次下载生成的音乐文件,同时借助提示增强器优化生成效果,提升创作效率。

Blend AI Studio

一款AI商品图生成工具,可让您轻松创建专业的产品照片和设计。告别招聘设计机构或自由职业者,释放人工智能的力量来增强您的视觉内容。

Natural Language Playlist

Natural Language Playlist 探索语言和音乐之间丰富而复杂的关系,并使用 Transformer 语言模型构建播放列表。由于没有更好的术语,音乐推荐是一种“闭门造车”的东西。

RealisHuman

RealisHuman 是一个用于优化生成图像中人体部位的后处理框架,采用两阶段方法提升手部和面部等部位的真实性。它通过参考原始图像生成逼真结构,并重新绘制周围区域实现无缝融合,支持多种图像风格,适用于游戏、影视、艺术等领域。

ShotAdapter

ShotAdapter是一款由Adobe与UIUC联合开发的文本到多镜头视频生成框架,通过过渡标记和局部注意力掩码策略,实现角色身份一致性和镜头内容精准控制。支持用户通过文本提示调节镜头数量、时长和背景,适用于影视、广告、教育、游戏等领域,具备高效、灵活和可扩展的技术特点。