文本到图像

ImageRAG

ImageRAG 是一种基于检索增强生成（RAG）技术的图像生成工具，通过动态检索相关图像提升文本到图像模型的生成能力。它能够增强对罕见概念的理解与生成，提升图像的真实度和相关性，支持多模态生成与个性化定制。无需额外训练即可适配多种 T2I 模型，广泛应用于创意设计、品牌推广、教育及影视等领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 692 浏览

Lumina

Lumina-Image 2.0 是一款开源图像生成模型，基于扩散模型与 Transformer 架构，具有 26 亿参数。它能根据文本描述生成高质量、多风格的图像，支持中英文提示词，并具备强大的复杂提示理解能力。模型支持多种推理求解器，适用于艺术创作、摄影风格图像生成及逻辑推理场景，兼具高效性和灵活性。

AI项目与工具 2025年06月12日 27 点赞 0 评论 826 浏览

SANA 1.5

SANA 1.5是由英伟达联合多所高校研发的高效线性扩散变换器，专用于文本到图像生成任务。其核心优势包括高效的训练扩展、模型深度剪枝、推理时扩展等技术，能够在不同计算预算下灵活调整模型性能。支持多语言输入，并具备开源特性，适用于创意设计、影视制作、教育等多个领域。实验表明，其生成质量接近行业领先水平，同时显著降低计算成本。

AI项目与工具 2025年06月12日 56 点赞 0 评论 631 浏览

SynCD

SynCD是由卡内基梅隆大学与Meta联合开发的高质量合成训练数据集，用于提升文本到图像模型的定制化能力。它通过生成同一对象在不同视角、光照和背景下的图像，结合共享注意力机制和3D资产引导，确保对象一致性。该数据集支持无调优模型训练，提升图像质量和身份保持能力，广泛应用于个性化内容生成、创意设计、虚拟场景构建等领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 599 浏览

TokenVerse

TokenVerse 是一种基于扩散模型的多概念图像生成工具，支持从单图或多图中解耦并组合视觉元素，如物体、材质、姿势等。通过优化调制空间，实现对复杂概念的局部控制，无需微调模型即可生成个性化图像，适用于创意设计、艺术创作和内容生成等多种场景。

AI项目与工具 2025年06月12日 38 点赞 0 评论 872 浏览

Textoon

Textoon是阿里巴巴通义实验室推出的AI工具，可根据文本生成Live2D格式的2D卡通角色，具备文本解析、外观生成、动画增强等功能。支持多语言输入，适用于游戏、影视、教育等多个场景，提升角色设计效率与表现力。

AI项目与工具 2025年06月12日 19 点赞 0 评论 766 浏览

Piclumen

Piclumen 是一款基于AI的图像生成工具，支持文本转图像、图像风格化、背景移除及图像修复等功能，可生成多种艺术风格的高质量图像。其高分辨率输出和便捷操作使其广泛应用于社交媒体、广告设计、艺术创作、游戏开发及教育领域，适合各类用户快速实现视觉创意。

AI项目与工具 2025年06月12日 91 点赞 0 评论 599 浏览

AnyStory

AnyStory是阿里巴巴通义实验室开发的文本到图像生成工具，支持单个或多个主体的高保真图像生成。其核心在于“编码-路由”架构，结合ReferenceNet和CLIP视觉编码器实现主体特征的精准建模与定位。通过解耦路由机制，有效避免多主体混淆，确保图像与文本描述高度一致。适用于创意设计、角色生成、广告制作等多个场景，提供高质量、个性化的图像生成能力。

AI项目与工具 2025年06月12日 42 点赞 0 评论 670 浏览

MultiBooth

MultiBooth是一种由多所高校和研究机构联合开发的多概念图像生成工具，能够根据文本提示生成包含多个指定概念的高质量图像。其核心技术包括单概念学习和多概念整合，采用多模态编码器、自适应归一化和区域定制化模块，实现高效、精准的图像生成。支持插件式架构，具备良好的扩展性和灵活性，适用于创意设计、广告、教育、电商及科研等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 705 浏览

PersonaMagic

PersonaMagic 是一种基于文本条件策略的人脸生成技术，通过动态嵌入学习和双平衡机制实现高保真个性化图像生成。该工具可依据文本提示调整人脸风格、表情和背景，同时保持身份特征。支持单图像训练，降低数据需求，并可与其他模型结合使用。实验显示其在文本对齐和身份保持方面表现优异，适用于娱乐、游戏、影视及营销等多个领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 607 浏览

文本到图像

首页

文本到图像

列表

默认

浏览次数

发布日期