模型 - 智狐AI导航

一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话，支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让人物头像说话的框架。

Ai开源项目 2025年06月05日 98 点赞 0 评论 644 浏览

解决AI图像生成中手部畸形的问题目前的图像生成模型，再生成图像方面已经非常出色，但在生成人类手部的图像时却常常出现问题，比如手指数量不对或者手形怪异。

Ai开源项目 2025年06月05日 27 点赞 0 评论 488 浏览

PIA是一款个性化图像动画生成器，可以生成具有高运动可控性和强文本和图像对齐性的视频，与条件图像对齐，通过文本实现动作控制，与各种个性化T2I模型兼容，无需特定调整。

Ai开源项目 2025年06月05日 51 点赞 0 评论 597 浏览

LucidDreamer，可以从单个图像的单个文本提示中生成可导航的3D场景。单击并拖动（导航）/移动和滚动（缩放）以感受3D。

Ai开源项目 2025年06月05日 73 点赞 0 评论 731 浏览

InvokeAI 是一个开源项目，是 Stable Diffusion 模型的领先创意引擎，它为使用 Stable Diffusion 模型生成高质量图像提供了简化的过程。

Ai开源项目 2025年06月05日 52 点赞 0 评论 546 浏览

Platon.AI柏拉图智能不仅仅是 AI 爬虫，也是 AI agents 的基础设施。 AI agents 要使用工具，就必须高速阅读理解在线网页，理解网页上的每一个元素——这就是 platon.AI 的技术。

Ai开源项目 2025年06月05日 95 点赞 0 评论 559 浏览

EasyPhoto是一个用于生成AI肖像的Webui UI插件，可以用来训练与你相关的数字化替身。

Ai开源项目 2025年06月05日 22 点赞 0 评论 575 浏览

AI Companion App，一键创建和训练属于你的AI伴侣/女朋友。

Ai开源项目 2025年06月05日 33 点赞 0 评论 516 浏览

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练，也是一个多任务模型，可以执行多语言语音识别以及语音翻译和语言识别。

Ai开源项目 2025年06月05日 90 点赞 0 评论 740 浏览

AIdea 是一款支持 GPT 以及国产大语言模型通义千问、文心一言等，支持 Stable Diffusion 文生图、图生图、 SDXL1.0、超分辨率、图片上色的全能型完全开源APP。

Ai开源项目 2025年06月05日 13 点赞 0 评论 1008 浏览

模型

首页

模型