扩散模型 - 智狐AI导航

ConsistentDreamer

ConsistentDreamer 是由华为慕尼黑研究中心开发的图像到 3D 资产生成技术，能通过单张图像生成多视图一致的 3D 网格。该技术采用多视图先验图像引导和分数蒸馏采样优化，结合动态权重平衡和多种损失函数，提升 3D 表面质量和纹理精度。支持复杂场景编辑、风格转换、物体修改等功能，适用于室内场景、艺术风格转换及跨视图一致性任务。

AI项目与工具 2025年06月12日 60 点赞 0 评论 574 浏览

HART

HART是一种由麻省理工学院研究团队开发的自回归视觉生成模型，能够生成1024×1024像素的高分辨率图像，质量媲美扩散模型。通过混合Tokenizer技术和轻量级残差扩散模块，HART实现了高效的图像生成，并在多个指标上表现出色，包括重构FID、生成FID以及计算效率。

AI项目与工具 2025年06月12日 93 点赞 0 评论 573 浏览

Emu Video

Meta开发的文本到视频生成模型，Emu Video使用扩散模型根据文本提示创建视频，首先生成图像，然后根据文本和生成的图像创建视频。

Ai视频生成 2025年06月05日 40 点赞 0 评论 571 浏览

视界一粟YiSu

北京极佳视界科技有限公司联合清华大学自动化系共同发布的Sora级视频生成大模型。

Ai视频生成 2025年06月05日 64 点赞 0 评论 571 浏览

FantasyID

FantasyID是由阿里巴巴集团与北京邮电大学联合开发的视频生成框架，基于扩散变换器和3D面部几何先验，实现高质量、身份一致的视频生成。其通过多视角增强和分层特征注入技术，提升面部动态表现，同时保持身份稳定性。支持多种应用场景，如虚拟形象、内容创作和数字人交互，具备无需微调的高效生成能力。

AI项目与工具 2025年06月12日 81 点赞 0 评论 570 浏览

JoyCaption

JoyCaption是一款开源图像提示词生成工具，支持多种图像风格和内容类型，具备丰富的生成模式和灵活的提示控制功能。它适用于社交媒体、图像标注、内容创作、视觉辅助及教育等多个场景，能够生成高质量的描述性字幕和提示词，提升图像处理和创作效率。该工具性能优越，且完全免费开放。

AI项目与工具 2025年01月16日 91 点赞 0 评论 568 浏览

DistriFusion是一个专为加速高分辨率扩散模型在多GPU环境中生成图像的分布式并行推理框架。通过将图像分割成多个小块并分配至不同设备上进行独立处理，它能够在不增加额外训练负担的情况下，将推理速度提升高达六倍，同时保持图像质量。其技术原理包括Patch Parallelism（分片并行）、异步通信、位移补丁并行性等，适用于多种现有的扩散模型。应用场景包括AI艺术创作、游戏和电影制作、VR/A

AI项目与工具 2025年06月12日 50 点赞 0 评论 568 浏览

PartEdit

PartEdit是一种基于预训练扩散模型的细粒度图像编辑工具，通过优化部分标记实现对图像对象各部分的精准定位与编辑。其采用非二进制掩码和自适应阈值策略，确保编辑内容自然融合，保留原始细节。支持真实图像和多部分同时编辑，无需重新训练模型，适用于艺术设计、影视制作、广告等多个领域。

AI项目与工具 2025年06月12日 59 点赞 0 评论 566 浏览

FluxSR

FluxSR是一种基于单步扩散模型的图像超分辨率工具，由多所高校与研究机构联合开发。它通过流轨迹蒸馏技术，将多步模型压缩为单步模型，实现高效且高质量的图像增强。采用TV-LPIPS感知损失和注意力多样化损失，有效提升图像细节并减少伪影。适用于老照片修复、影视制作、医学影像增强等多个领域，具备高性能与低计算成本优势。

AI项目与工具 2025年06月12日 24 点赞 0 评论 565 浏览

ACE

ACE是一款基于扩散Transformer架构的多模态图像生成与编辑工具，通过长上下文条件单元（LCU）和统一条件格式实现自然语言指令的理解与执行。它支持图像生成、编辑、多轮交互等多种任务，适用于艺术创作、媒体制作、广告设计、教育培训等多个领域，提供高效且灵活的视觉内容解决方案。

AI项目与工具 2025年06月12日 74 点赞 0 评论 562 浏览

扩散模型

首页

扩散模型

列表

默认

浏览次数

发布日期