图像 - 智狐AI导航

Stitch

Stitch是谷歌实验室推出的基于生成式AI的工具，能够将简单的英语描述或图像快速转化为用户界面（UI）设计及前端代码。它基于Gemini 2.5 Pro模型的多模态能力，支持文本、图像输入，并能识别图像生成UI组件。Stitch可生成简洁可用的前端代码，支持HTML、CSS和JavaScript，同时与Figma无缝集成，便于团队协作和优化设计。其功能包括文本生成设计、图像生成设计、代码生成与优

AI项目与工具 2025年06月11日 91 点赞 0 评论 798 浏览

PuLID

PuLID是一种由字节跳动团队开发的个性化文本到图像生成技术，主要通过对比对齐和快速采样方法实现高效ID定制。该技术能够生成高度逼真的面部图像，同时保留原始图像的风格元素，支持灵活的个性化编辑。PuLID具有快速出图能力，无需繁琐的模型调整，且与多种现有模型兼容。它适用于艺术创作、虚拟形象定制、影视制作、广告和社交媒体等多个领域。

AI项目与工具 2024年01月01日 39 点赞 0 评论 798 浏览

Sana

SANA是一个由NVIDIA、麻省理工学院和清华大学共同研发的文本到图像生成框架，支持生成高达4096×4096分辨率的高清图像。它采用了深度压缩自编码器、线性扩散变换器（Linear DiT）和小型语言模型作为文本编码器，并通过优化的训练和采样策略提升了生成效率。SANA在模型大小和运行速度上具备显著优势，适合多种应用场景，包括艺术创作、游戏开发、广告设计和科学研究等。

AI项目与工具 2025年06月12日 11 点赞 0 评论 798 浏览

YouCam AI Pro

一款多功能人工智能艺术生成器，允许用户从文本和图像创建高质量的数字艺术和头像。 YouCam AI Pro 专注于创造力和易用性，适合艺术家、设计师和任何有兴趣探索人工智能生成视觉效果潜力的人。

Ai绘画生成 2025年06月05日 35 点赞 0 评论 798 浏览

Pixtral 12B

Pixtral 12B是一款由法国初创企业Mistral开发的多模态AI模型，能够同时处理图像和文本数据。该模型包含120亿参数，大小约为24GB，基于Nemo 12B文本模型构建。它具备强大的图像和文本处理能力，能够执行图像描述生成、统计照片中的物体数量等任务，并在多个基准测试中表现出色。Pixtral 12B将根据Apache 2.0许可证开源，用户可以自由下载和微调该模型。应用场景广泛，包括

AI项目与工具 2025年06月12日 69 点赞 0 评论 797 浏览