扩散模型 - 智狐AI导航

sCM

sCM是一种由OpenAI开发的基于扩散模型的连续时间一致性模型，通过简化理论框架与优化采样流程，实现了图像生成速度的大幅提升。该模型仅需两步采样即可生成高质量图像，且速度比传统扩散模型快50倍。得益于连续时间框架和多项技术改进，sCM不仅提高了训练稳定性，还提升了生成质量。其应用场景广泛，包括视频生成、3D建模、音频处理及跨媒介内容创作，适用于艺术设计、游戏开发、影视制作等多个行业。

AI项目与工具 2025年06月12日 50 点赞 0 评论 708 浏览

PixArt-Σ是一款基于扩散Transformer架构（DiT）的文本生成图像模型，专为生成高达4K分辨率的高质量图像而设计。该模型通过整合高级元素并采用从弱到强的训练方法，不仅提升了生成图像的保真度，还增强了图像与文本提示之间的对齐效果。PixArt-Σ的生成图像在美学质量上可媲美当前顶级的文本到图像产品，并且在遵循文本提示方面表现出色。主要功能包括4K分辨率图像生成、高保真转换、高效率训练和

AI项目与工具 2024年01月01日 82 点赞 0 评论 708 浏览

Wonderland

Wonderland是一项由多伦多大学、Snap和UCLA联合开发的技术，能够基于单张图像生成高质量的3D场景，并支持精确的摄像轨迹控制。它结合了视频扩散模型和大规模3D重建模型，解决了传统3D重建技术中的视角失真问题，实现了高效的三维场景生成。Wonderland在多个基准数据集上的3D场景重建质量均优于现有方法，广泛应用于建筑设计、虚拟现实、影视特效、游戏开发等领域。

AI项目与工具 2025年06月12日 23 点赞 0 评论 711 浏览

OminiControl

OminiControl是一款高效且参数节约的图像生成框架，专为扩散变换器模型设计，支持主题驱动和空间控制。通过增加少量参数，它能够生成高质量图像并保持主题一致性，适用于多种应用场景，包括艺术创作、游戏开发和广告设计等。其强大的多模态注意力机制和灵活的架构使其成为图像生成领域的创新工具。

AI项目与工具 2025年06月12日 94 点赞 0 评论 714 浏览

JoyVASA

JoyVASA是一个基于扩散模型的音频驱动数字人头项目，能够生成与音频同步的面部动态和头部运动。其主要功能包括唇形同步、表情控制及动物面部动画生成，支持多语言和跨物种动画化。项目采用两阶段训练方法，结合解耦面部表示与扩散模型技术，生成高质量动画视频，广泛应用于虚拟助手、娱乐媒体、教育、广告等多个领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 715 浏览

AniPortrait

AniPortrait是一款由腾讯开源的AI视频生成框架，通过音频和一张参考肖像图片生成高质量的动画。该框架包含两个核心模块：Audio2Lmk模块将音频转换为2D面部标记点，而Lmk2Video模块则基于这些标记点生成连贯且逼真的视频动画。AniPortrait以其高质量的视觉效果、时间一致性和灵活的编辑能力著称，能够精确捕捉面部表情和嘴唇动作。

AI项目与工具 2025年06月12日 68 点赞 0 评论 716 浏览

OutofFocus

OutofFocus是一款基于AI的图像编辑工具，支持文本提示驱动的图像生成与编辑。其核心功能包括风格转换、内容填充、图像修复和增强等，通过自然语言处理与扩散逆过程重建技术实现高效编辑。该工具具有易用性和灵活性，广泛适用于艺术创作、内容营销、教育研究等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 721 浏览

Animate Anyone

Animate Anyone是一款由阿里巴巴智能计算研究院开发的开源框架，旨在将静态图像中的角色或人物动态化。它采用扩散模型，结合ReferenceNet、Pose Guider姿态引导器和时序生成模块等技术，确保输出的动态视频具有高度一致性和稳定性。该框架支持多种应用，包括角色动态化、时尚视频合成及人类舞蹈生成，用户可通过GitHub或Hugging Face社区轻松体验。

AI项目与工具 2025年06月12日 19 点赞 0 评论 724 浏览

GenCast

GenCast是一款基于扩散模型的AI气象预测工具，可提供长达15天的高精度全球天气预报，尤其擅长预测极端天气事件。它采用0.25°纬度-经度分辨率生成高精度集合预报，并通过并行计算在8分钟内完成预测。GenCast已开源，支持学术界和行业用户进一步研究与应用。

AI项目与工具 2025年06月12日 25 点赞 0 评论 742 浏览

DynVFX

DynVFX是一种基于文本指令的视频增强技术，能够将动态内容自然地融入真实视频中。它结合了文本到视频扩散模型与视觉语言模型，通过锚点扩展注意力机制和迭代细化方法，实现新内容与原始视频的像素级对齐和融合。无需复杂输入或模型微调，即可完成高质量的视频编辑，适用于影视特效、内容创作及教育等多个领域。

AI项目与工具 2025年06月12日 85 点赞 0 评论 773 浏览

扩散模型

首页

扩散模型

列表

默认

浏览次数

发布日期

sCM

PixArt