扩散模型 - 智狐AI导航

LucidDreamer，可以从单个图像的单个文本提示中生成可导航的3D场景。单击并拖动（导航）/移动和滚动（缩放）以感受3D。

Ai开源项目 2025年06月05日 73 点赞 0 评论 731 浏览

解决AI图像生成中手部畸形的问题目前的图像生成模型，再生成图像方面已经非常出色，但在生成人类手部的图像时却常常出现问题，比如手指数量不对或者手形怪异。

Ai开源项目 2025年06月05日 27 点赞 0 评论 487 浏览

一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话，支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。

Ai开源项目 2025年06月05日 98 点赞 0 评论 641 浏览

一个高质量视频生成的开放式扩散模型，相比之前的生成视频模型，VideoDrafter最大的特点是能在主体不变的基础上，一次性生成多个场景的视频。

Ai开源项目 2025年06月05日 89 点赞 0 评论 738 浏览

从音频生成全身逼真的虚拟人物形象。它可以从多人对话中语音中生成与对话相对应的逼真面部表情、完整身体和手势动作。

Ai开源项目 2025年06月05日 77 点赞 0 评论 516 浏览

百度公司推出的视频生成模型，能够以文本和图像的任意组合作为输入条件进行视频生成。

Ai开源项目 2025年06月05日 22 点赞 0 评论 718 浏览

一个利用预训练的文本到图像扩散模型进行视频编辑的框架。它无需进一步训练或微调，即可实现一致的视频编辑效果。

Ai开源项目 2025年06月05日 25 点赞 0 评论 508 浏览

字节跳动研发的一种视频生成模型，PixelDance通过结合文本指导和首尾帧图片指导的方式，能够生成具有复杂场景与动作的视频。

Ai平台模型 2025年06月05日 44 点赞 0 评论 1356 浏览

一款AI音乐生成器，允许用户通过将文本提示、歌词或旋律转换为完整的不同风格的歌曲。它采用了潜在扩散模型，这使得它与其他人工智能音乐生成模型相比更加可控。

Ai语音工具 2025年06月05日 94 点赞 0 评论 702 浏览

由Riffusion推出的一款基于扩散模型（Diffusion Model）的全新音乐生成模型，该工具能够通过“想象”生成音频的声谱图（Spectrogram），然后将其转换为音频。

Ai语音工具 2025年06月05日 33 点赞 0 评论 855 浏览

扩散模型

首页

扩散模型