Transformer

PixArt

PixArt-Σ是一款基于扩散Transformer架构（DiT）的文本生成图像模型，专为生成高达4K分辨率的高质量图像而设计。该模型通过整合高级元素并采用从弱到强的训练方法，不仅提升了生成图像的保真度，还增强了图像与文本提示之间的对齐效果。PixArt-Σ的生成图像在美学质量上可媲美当前顶级的文本到图像产品，并且在遵循文本提示方面表现出色。主要功能包括4K分辨率图像生成、高保真转换、高效率训练和

AI项目与工具 2024年01月01日 82 点赞 0 评论 865 浏览

Meissonic

Meissonic是一款由阿里巴巴集团与多家高校联合开发的文本到图像合成模型，基于掩蔽图像建模技术，结合多模态和单模态Transformer层、高级位置编码策略及优化采样条件，实现了高分辨率图像生成、文本到图像转换、零样本图像编辑等功能。其高效性能使其适用于多种场景，包括艺术创作、媒体娱乐、广告营销、教育及电子商务等领域。 ---

AI项目与工具 2025年06月12日 68 点赞 0 评论 864 浏览

UIGEN

一个基于 Qwen2.5-Coder-7B 模型微调的开源 UI 设计生成工具，能够根据用户输入的提示生成结构清晰且符合标准的 HTML 和 CSS 代码

Ai编程建站 2025年06月05日 44 点赞 0 评论 862 浏览

Etna模型

一个文字转视频的AIGC模型，Etna能够根据简短的文本描述生成相应的视频内容，支持生成时长为8-15秒的视频，且视频流畅度极高，每秒可达60帧。

Ai视频生成 2025年06月05日 28 点赞 0 评论 860 浏览

360Zhinao2

360Zhinao2-7B是一款由360公司开发的大规模AI语言模型，具备强大的语言理解和生成能力，支持多语言交流和复杂的数学逻辑推理。其核心特性包括灵活的上下文处理、高效的训练技术和广泛的适用性，可应用于智能客服、教育辅助、内容创作和信息检索等多个领域。

AI项目与工具 2025年06月12日 89 点赞 0 评论 857 浏览

TripoSR

TripoSR是一款由Stability AI与VAST联合开发的开源3D生成模型，能够在不到0.5秒内从单张2D图像生成高质量的3D模型。基于Transformer架构和大型重建模型（LRM）设计，采用先进的图像编码、三平面NeRF表示及优化训练策略，支持无GPU设备运行。适用于游戏开发、影视制作、建筑设计、产品设计等多个领域，具有高效、高精度和广泛适用性的特点。

AI项目与工具 2025年06月12日 80 点赞 0 评论 849 浏览

KuaiFormer

KuaiFormer是一款基于Transformer架构的检索框架，专为大规模内容推荐系统设计。它通过重新定义检索流程，将传统分数估计任务转换为“下一个动作预测”，从而实现高效的多兴趣提取和实时兴趣捕捉。KuaiFormer具备多兴趣查询Token、自适应序列压缩、稳定训练等核心技术，已在快手App的短视频推荐系统中广泛应用，显著提升了用户体验和平台效率。 ---

AI项目与工具 2025年06月12日 65 点赞 0 评论 844 浏览

YAYI2

中科闻歌研发的一款新一代开源大语言模型，中文名为“雅意”。该模型包含 Base 和 Chat 版本，参数规模达到 30B，基于 Transformer 架构构建。

Ai平台模型 2025年06月05日 11 点赞 0 评论 841 浏览

Veo 2

Veo 2 是一款由 Google DeepMind 开发的 AI 视频生成工具，支持高达 4K 分辨率，可生成高质量视频并模拟物理现象及人类表情。它具备修复、外扩、插值等功能，广泛应用于电影制作、虚拟旅游、教育视频等领域，具有高精度和安全性。

AI项目与工具 2025年06月12日 85 点赞 0 评论 830 浏览

Lumina

Lumina-Image 2.0 是一款开源图像生成模型，基于扩散模型与 Transformer 架构，具有 26 亿参数。它能根据文本描述生成高质量、多风格的图像，支持中英文提示词，并具备强大的复杂提示理解能力。模型支持多种推理求解器，适用于艺术创作、摄影风格图像生成及逻辑推理场景，兼具高效性和灵活性。

AI项目与工具 2025年06月12日 27 点赞 0 评论 825 浏览

Transformer

首页

Transformer

列表

默认

浏览次数

发布日期