生成 - 智狐AI导航

一个开源项目，允许用户使用 OpenAI Sora 模型使用文本在线生成视频，从而简化视频创建，并具有轻松的一键网站部署功能。

Ai开源项目 2025年06月05日 62 点赞 0 评论 841 浏览

一款革命性的语音面部动画生成工具，借助 Media2Face，现在可以从任何音频、图像或文本输入无缝生成逼真且富有表现力的面部动画。

Ai开源项目 2025年06月05日 56 点赞 0 评论 968 浏览

一个专门为DuckDB数据库设计的文本到SQL的模型，你可以使用自然语言说描述你的需求，它会自动转换成SQL代码。

Ai开源项目 2025年06月05日 32 点赞 0 评论 419 浏览

谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构，能够一次性生成整个视频的时间长度，确保了生成视频的连贯性和逼真度。

Ai开源项目 2025年06月05日 74 点赞 0 评论 717 浏览

一种从单个图像到一致的多视图扩散基础模型，旨在使用单视图输入生成 3D 一致的多视图图像。

Ai开源项目 2025年06月05日 19 点赞 0 评论 899 浏览

一个高质量视频生成的开放式扩散模型，相比之前的生成视频模型，VideoDrafter最大的特点是能在主体不变的基础上，一次性生成多个场景的视频。

Ai开源项目 2025年06月05日 89 点赞 0 评论 739 浏览

一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话，支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。

Ai开源项目 2025年06月05日 98 点赞 0 评论 644 浏览

解决AI图像生成中手部畸形的问题目前的图像生成模型，再生成图像方面已经非常出色，但在生成人类手部的图像时却常常出现问题，比如手指数量不对或者手形怪异。

Ai开源项目 2025年06月05日 27 点赞 0 评论 488 浏览

LucidDreamer，可以从单个图像的单个文本提示中生成可导航的3D场景。单击并拖动（导航）/移动和滚动（缩放）以感受3D。

Ai开源项目 2025年06月05日 73 点赞 0 评论 731 浏览

InvokeAI 是一个开源项目，是 Stable Diffusion 模型的领先创意引擎，它为使用 Stable Diffusion 模型生成高质量图像提供了简化的过程。

Ai开源项目 2025年06月05日 52 点赞 0 评论 546 浏览

生成

首页

生成