Diffusion

PoseTalk

PoseTalk 是一款基于文本和音频驱动的开源工具,专注于生成自然且逼真的头部动画视频。它通过 Pose Latent Diffusion (PLD) 模型和级联网络实现唇部同步与运动细化,广泛应用于虚拟助手、在线教育和娱乐等领域,提供多样化的动画生成能力和高度精准的唇形同步效果。

绘世启动器

绘世启动器是由B站UP主@秋葉aaaki开发的电脑桌面应用,旨在简化Stable Diffusion-WebUI项目的启动和管理。它支持一键启动、修复、更新、模型下载、模型管理和模型训练等功能,特别适合低配电脑和无编程基础的用户。启动器内置疑难解答系统,能够诊断并解决常见错误,同时支持部署SD-WebUI、ComfyUI等多种WebUI界面,便于用户构建完整的环境。

PixVerse V2

PixVerse V2是一款基于Diffusion+Transformer(DiT)架构并结合自研时空注意力机制的AI视频生成工具。它支持生成长度可达40秒的视频,单个片段最长可达8秒,且能保持视频片段间的一致性。用户可通过简单操作生成并编辑视频,适用于创意专业人士、社交媒体用户、企业营销人员及独立艺术家等多种人群。

StoryDiffusion

StoryDiffusion能够保持人物一致性的绘图AI,可用SDXL模型

OOTDiffusion

OOTDiffusion的正式实现:基于潜在扩散的可控虚拟试穿的服装融合