注意力机制

Qwen2vl

Qwen2VL-Flux 是一款基于多模态图像生成的模型，结合了 Qwen2VL 和 FLUX 技术。它支持多种生成模式，包括变体生成、图像到图像转换、智能修复和 ControlNet 引导生成，并具备深度估计和线条检测功能。该模型提供灵活的注意力机制和高分辨率输出，适用于艺术创作、内容营销、游戏开发等多个领域。

AI项目与工具 2025年06月12日 99 点赞 0 评论 420 浏览

Transfusion是由Meta公司开发的多模态AI模型，能够同时生成文本和图像，并支持图像编辑功能。该模型通过结合语言模型的下一个token预测和扩散模型，在单一变换器架构上处理混合模态数据。Transfusion在预训练阶段利用了大量的文本和图像数据，表现出强大的扩展性和优异的性能。其主要功能包括多模态生成、混合模态序列训练、高效的注意力机制、模态特定编码、图像压缩、高质量图像生成、文本生成

AI项目与工具 2025年06月12日 26 点赞 0 评论 398 浏览

FitDiT

FitDiT是一种基于Diffusion Transformers架构的高保真虚拟试穿技术，通过服装纹理提取器和先验演化技术精确捕捉服装细节，同时采用扩张-松弛掩码策略优化尺寸适配。它能在短时间内生成高质量的试穿图像，适用于电子商务、时尚设计、个性化定制以及增强现实等领域，为用户提供逼真的虚拟试穿体验。

AI项目与工具 2025年06月12日 97 点赞 0 评论 392 浏览

Open

Open-Sora是一个开源视频生成模型，基于DiT架构，通过三个阶段的训练（大规模图像预训练、大规模视频预训练和高质量视频数据微调），生成与文本描述相符的视频内容。该模型包括预训练的VAE、文本编码器和STDiT（Spatial-Temporal Diffusion Transformer）核心组件，利用空间-时间注意力机制和交叉注意力模块实现视频生成。项目旨在提供全面的视频生成模型训练过程，供

AI项目与工具 2024年01月01日 97 点赞 0 评论 383 浏览

FlashVideo

FlashVideo是由字节跳动团队研发的高分辨率视频生成框架，采用两阶段方法优化计算效率。第一阶段在低分辨率下生成高质量内容，第二阶段通过流匹配技术提升至1080p，仅需4次函数评估。其特点包括高效计算、细节增强、快速预览及多场景应用，适用于广告、影视、教育等领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 378 浏览

Show

Show-o 是一款基于统一 Transformer 架构的多模态 AI 工具，集成了自回归和离散扩散建模技术，可高效处理视觉问答、文本到图像生成、图像修复与扩展以及混合模态生成等多种任务。其创新性技术显著提高了生成效率，减少了采样步骤，适用于社交媒体内容创作、虚拟助手、教育与培训、广告营销、游戏开发及影视制作等多个领域。

AI项目与工具 2025年06月12日 86 点赞 0 评论 378 浏览

DreamVideo

DreamVideo-2是一款由复旦大学和阿里巴巴集团等机构共同开发的零样本视频生成框架，能够利用单一图像及界定框序列生成包含特定主题且具备精确运动轨迹的视频内容。其核心特性包括参考注意力机制、混合掩码参考注意力、重加权扩散损失以及基于二值掩码的运动控制模块，这些技术共同提升了主题表现力和运动控制精度。DreamVideo-2已在多个领域如娱乐、影视制作、广告营销、教育及新闻报道中展现出广泛应用前

AI项目与工具 2025年06月12日 65 点赞 0 评论 371 浏览

FramePainter

FramePainter 是一款基于AI的交互式图像编辑工具，结合视频扩散模型与草图控制技术，支持用户通过简单操作实现精准图像修改。其核心优势包括高效训练机制、强泛化能力及高质量输出。适用于概念艺术、产品展示、社交媒体内容创作等场景，具备低训练成本和自然的图像变换能力。

AI项目与工具 2025年06月12日 70 点赞 0 评论 365 浏览

MCA

MCA-Ctrl是由中科院计算所与国科大联合开发的图像定制生成框架，通过引入SAGI和SALQ注意力控制策略及主体定位模块，提升图像生成质量与一致性。支持零样本图像生成，适用于主体特征保持、背景一致性维护等多种任务，广泛应用于数字内容创作、广告设计、艺术创作等领域。

AI项目与工具 2025年06月11日 82 点赞 0 评论 346 浏览

DCEdit

DCEdit是一款基于双层控制机制的图像编辑工具，结合精确语义定位策略与视觉、文本自注意力优化，提升图像编辑的准确性和可控性。无需额外训练即可应用于现有扩散模型，支持复杂场景下的精细编辑任务，如对象替换、颜色调整等，适用于广告、影视、社交媒体等多个领域。

AI项目与工具 2025年06月12日 15 点赞 0 评论 324 浏览

注意力机制

首页

注意力机制

列表

默认

浏览次数

发布日期