图像 - 智狐AI导航

IFAdapter

IFAdapter是一种由腾讯与新加坡国立大学联合开发的文本到图像生成模型，专为提高多实例图像生成时的空间定位与特征表达准确性而设计。它通过“外观标记”与“实例语义图”两大关键技术解决了传统方法中的定位与特征问题，并支持以即插即用的形式融入现有扩散模型，无需重新训练即可实现高效的空间控制。

AI项目与工具 2025年06月12日 24 点赞 0 评论 835 浏览

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型，具有强大的图像与文本对齐能力。它支持多种语言输入，具备零样本分类、图像-文本检索等功能，并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体，适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构，具备良好的兼容性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 835 浏览

Pikaso

Pikaso，免费的在线实时涂鸦出图工具，用户只需快速绘制草图即可创建他们能想象到的任何图像。它不仅仅是一个人工智能工具，它是你创意本质的延伸。

Ai绘画生成 2025年06月05日 100 点赞 0 评论 835 浏览

BlueWillow

BlueWillow 是一种基于 Web并使用人工智能根据您的文本输入生成逼真而美丽的图像。

Ai绘画生成 2025年06月05日 36 点赞 0 评论 835 浏览

In

In-Context LoRA是一种基于扩散变换器（DiTs）的图像生成框架，通过微调少量数据实现多样化图像生成任务。它无需修改原始模型结构，减少了对大规模标注数据的依赖，同时保持了高质量的生成效果。该工具支持多任务图像生成、上下文学习能力、任务无关性以及条件图像生成等功能，适用于故事板生成、字体设计、家居装饰等多个领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 834 浏览

万相2.1

通义万相2.1是一款基于自研VAE和DiT架构的AI视频生成工具，支持高精度视频编解码与中文文字生成，具备复杂动作展现、物理规律还原、中英文特效生成及艺术风格转换等功能。同时支持图像生成，适用于影视制作、广告视频、教学辅助、文化创作等多个领域，提供高效的创作体验与高质量输出。

AI项目与工具 2025年06月12日 63 点赞 0 评论 834 浏览

Plask

Plask，一种基于 Web 的 AI 解决方案，用于生成生成具有定制姿势和角度的3D 图像。而无需花费数小时在绘图、摆姿势和渲染上。

3D&游戏 2025年06月05日 40 点赞 0 评论 834 浏览

LightLab

LightLab是一款基于扩散模型的图像光源控制工具，支持对图像中的光源强度、颜色、环境光以及虚拟光源进行精细调整。通过结合真实照片与合成图像训练，该工具能生成逼真的光照效果，如阴影和反射。其交互式界面使用户能够直观地进行光照编辑，适用于摄影后期、影视特效、室内设计、游戏开发和广告制作等多个领域。

AI项目与工具 2025年06月11日 34 点赞 0 评论 834 浏览

SuperEdit

SuperEdit是由字节跳动与佛罗里达中央大学联合开发的图像编辑工具，基于扩散模型和优化监督信号，实现高精度的自然语言指令图像编辑。其特点包括高效训练、保留图像质量以及支持多种编辑类型。该工具适用于内容创作、影视、游戏、教育和医疗等多个领域，提供灵活且高效的图像处理方案。

AI项目与工具 2025年06月11日 100 点赞 0 评论 833 浏览

Image

Image-01 是一款由 MiniMax 开发的文本到图像生成模型，能够根据文本描述精准生成高质量、高分辨率图像，支持多种纵横比输出。具备优秀的人物与物体渲染能力，适用于艺术创作、广告设计、影视制作等多个领域。支持高效批量生成，单次最多输出 9 张图像，每分钟处理 10 个请求，提升创作效率。采用扩散模型与 Transformer 架构，结合线性注意力与 MoE 技术，确保图像质量与生成效率。

AI项目与工具 2025年06月12日 95 点赞 0 评论 832 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期