文本到图像

SDXL

SDXL-Lightning是一种基于扩散模型的文本到图像生成技术,由字节跳动的研究团队开发。该模型通过结合渐进式和对抗式蒸馏方法,能够在一至少数步骤内快速生成1024像素分辨率的高质量图像。该模型提供开源模型和权重,支持与现有的LoRA模块和控制插件兼容,可以轻松集成到现有的图片生成系统中。核心技术包括扩散模型、渐进式蒸馏、对抗式蒸馏和鉴别器设计,以确保生成图像的质量和多样性。

AnimateDiff

AnimateDiff是一款由上海人工智能实验室、香港中文大学和斯坦福大学的研究人员共同开发的框架,旨在将文本到图像模型扩展为动画生成器。该框架利用大规模视频数据集中的运动先验知识,允许用户通过文本描述生成动画序列,无需进行特定的模型调优。AnimateDiff支持多种领域的个性化模型,包括动漫、2D卡通、3D动画和现实摄影等,并且易于与现有模型集成,降低使用门槛。

Make

Make-A-Character(简称Mach)是由阿里巴巴集团智能计算研究院开发的3D数字人生成框架,通过文本描述快速生成逼真的3D角色。该系统支持灵活的定制化、高度逼真的渲染、完整的角色模型及动画支持。其工作流程包括文本解析、视觉提示生成、参考肖像图像生成、密集面部坐标检测、几何生成、纹理生成、纹理修正、头发生成、资产匹配和角色装配。Mach生成的角色模型可以无缝集成到游戏和电影行业的标准CG

DiffusionGPT

DiffusionGPT是一款基于大型语言模型的开源文本到图像生成系统,由字节跳动与中山大学联合开发。它采用思维树和优势数据库技术,能够解析和处理多样化的文本提示,生成高质量图像。系统通过多模型的选择与集成、基于人类反馈的优化以及高效的图像生成执行,实现了从文本到图像的无缝转换。DiffusionGPT适用于多种应用场景,具有广泛适用性和灵活性。

ImageFX

ImageFX是一款由谷歌开发的基于人工智能的文本到图像生成工具,利用先进的技术生成高质量图像。其主要功能包括文本到图像生成、Expressive Chips快速调整关键词、高质量图像生成能力、SynthID数字水印以确保图像真实性和内容安全措施,如过滤暴力、冒犯内容及个人图像生成。

Playground AI

Playground AI 是一款流行的人工智能绘图和图像编辑工具,主要功能包括AI文本到图像生成、创意社区作品分享、提示词智能优化和图像到图像的转换。它提供灵活的创作模式,支持用户上传现有图片或草图生成全新的艺术作品。此外,Playground AI 还提供了一个UGC创作社区,用户可以在其中发现多种风格的图片,并借鉴提示词进行创作。Playground AI 提供了免费版和多个付费版本,以满足

Red_Panda

Red_Panda 是一款由 Recraft AI 开发的先进 AI 图像生成工具,以其高精度的文本到图像转换能力和卓越的解剖学准确性著称。它能够生成复杂长文本对应的高质量图像,支持用户通过风格控制和图形设计工具实现个性化定制。此外,Red_Panda 还具备矢量图像生成能力,并集成 AI 图像编辑功能,广泛应用于设计、品牌营销、教育及出版等多个领域。

HiDiffusion

大幅提升扩散模型的图像生成质速度提升6倍,由字节跳动的研究团队开发,只需添加一行代码即可

PIA

PIA是一款个性化图像动画生成器,可以生成具有高运动可控性和强文本和图像对齐性的视频,与条件图像对齐,通过文本实现动作控制,与各种个性化T2I模型兼容,无需特定调整。