图像生成 - 智狐AI导航

GarDiff

GarDiff是一款基于人工智能的虚拟试穿工具，采用CLIP和VAE编码提取服装外观先验，并结合服装聚焦适配器和高频细节增强算法，生成高保真试穿图像。它能够精准对齐服装与人体姿态，保留复杂图案与纹理，适用于电子商务、时尚设计、个性化推荐、社交媒体、虚拟时尚秀及游戏等多个领域，提供真实且沉浸式的在线试穿体验。

AI项目与工具 2025年06月12日 55 点赞 0 评论 790 浏览

OneStory.Art

一款创新的AI故事小说网文生成助手，OneStory.Art通过AI快速生成连续性、一致性的角色和故事网文，提供影视分镜、网文图片、游戏漫画以及更多内容创作。

AI写作对话 2025年06月05日 28 点赞 0 评论 791 浏览

DreamActor

DreamActor-M1是字节跳动推出的AI图像动画框架，能够将静态照片转化为高质量动态视频。其核心在于混合引导机制，结合隐式面部表示、3D头球和身体骨架，实现对表情和动作的精准控制。支持多语言语音驱动、口型同步、灵活运动转移及多样化风格适配，适用于虚拟角色创作、个性化动画生成、虚拟主播制作及创意广告等领域，具备高保真、强连贯性和广泛适用性。

AI项目与工具 2025年06月12日 86 点赞 0 评论 793 浏览

蓝心大模型

蓝心大模型是由vivo研发的通用大模型矩阵，包括语言、端侧、语音、图像及多模态模型。该模型在内容创作、知识问答、逻辑推理、代码生成、信息提取、多语言翻译等方面表现出色。蓝心端侧大模型3B在移动设备上表现出色，蓝心语音大模型支持多语言，蓝心图像大模型融合了中国特色和东方美学，蓝心多模态大模型则提供了流畅的视频对话体验。

AI项目与工具 2025年06月12日 76 点赞 0 评论 794 浏览

文心iRAG

文心iRAG是百度推出的一种检索增强型文生图技术，它通过结合百度搜索引擎中的海量图片资源与先进基础模型能力，解决了大模型在文生图时容易出现的幻觉问题，显著提高了生成图片的真实性和准确性。此技术不仅适用于广告、媒体、教育等多个领域，还具备低成本、高效率的特点，能够快速生成满足需求的高质量图像。

AI项目与工具 2025年06月12日 66 点赞 0 评论 795 浏览

Imaiger

Imaiger 是一种可让您搜索和生成由AI创建的图像和在线工具。您还可以使用 Imaiger 通过选择不同的样式、颜色和主题来创建自己的图像。

Ai图片处理 2025年06月05日 18 点赞 0 评论 795 浏览

SNOOPI

SNOOPI是一种基于增强单步扩散模型的文本到图像生成框架，通过PG-SB和NASA技术提高了模型的稳定性和控制力。它在多方面表现出色，包括提高生成效率、排除不期望的图像元素、支持多种模型背板以及生成高质量图像。SNOOPI广泛应用于数字艺术、游戏开发、广告、社交媒体和影视等领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 795 浏览

Scenethesis

Scenethesis是NVIDIA推出的AI框架，可通过文本生成高质量的3D场景。它结合LLM与视觉技术，经过布局规划、视觉细化、物理优化和场景验证四个阶段，确保生成结果具备物理合理性和空间连贯性。支持用户交互与多样化场景构建，广泛应用于VR/AR、游戏开发、具身智能及虚拟内容创作等领域。

AI项目与工具 2025年06月11日 13 点赞 0 评论 797 浏览

PuLID

PuLID是一种由字节跳动团队开发的个性化文本到图像生成技术，主要通过对比对齐和快速采样方法实现高效ID定制。该技术能够生成高度逼真的面部图像，同时保留原始图像的风格元素，支持灵活的个性化编辑。PuLID具有快速出图能力，无需繁琐的模型调整，且与多种现有模型兼容。它适用于艺术创作、虚拟形象定制、影视制作、广告和社交媒体等多个领域。

AI项目与工具 2024年01月01日 39 点赞 0 评论 798 浏览

Sana

SANA是一个由NVIDIA、麻省理工学院和清华大学共同研发的文本到图像生成框架，支持生成高达4096×4096分辨率的高清图像。它采用了深度压缩自编码器、线性扩散变换器（Linear DiT）和小型语言模型作为文本编码器，并通过优化的训练和采样策略提升了生成效率。SANA在模型大小和运行速度上具备显著优势，适合多种应用场景，包括艺术创作、游戏开发、广告设计和科学研究等。

AI项目与工具 2025年06月12日 11 点赞 0 评论 798 浏览

图像生成

首页

图像生成

列表

默认

浏览次数

发布日期