注意力机制

首页

注意力机制

列表

默认

浏览次数

发布日期

CustomVideoX

CustomVideoX

CustomVideoX是一种基于视频扩散变换器的个性化视频生成框架，能够根据参考图像和文本描述生成高质量视频。其核心技术包括3D参考注意力机制、时间感知注意力偏差（TAB）和实体区域感知增强（ERAE），有效提升视频的时间连贯性和语义一致性。支持多种应用场景，如艺术设计、广告营销、影视制作等，具备高效、精准和可扩展的特点。

AI项目与工具 2025年06月12日 98 点赞 0 评论 594 浏览

FlashVideo

FlashVideo

FlashVideo是由字节跳动团队研发的高分辨率视频生成框架，采用两阶段方法优化计算效率。第一阶段在低分辨率下生成高质量内容，第二阶段通过流匹配技术提升至1080p，仅需4次函数评估。其特点包括高效计算、细节增强、快速预览及多场景应用，适用于广告、影视、教育等领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 555 浏览

EliGen

EliGen

EliGen是由浙江大学与阿里巴巴集团联合开发的实体级可控图像生成框架，采用区域注意力机制实现对图像中实体的精确控制，支持多实体修复、风格化生成及交互式编辑。基于50万高质量注释样本训练，具备强大泛化能力，适用于虚拟场景、角色设计、数据合成及产品展示等场景。

AI项目与工具 2025年06月12日 97 点赞 0 评论 876 浏览

3DIS

3DIS

3DIS-FLUX是一种基于深度学习的多实例图像生成框架，采用两阶段流程：先生成场景深度图，再进行细节渲染。通过注意力机制实现文本与图像的精准对齐，无需额外训练即可保持高生成质量。适用于电商设计、创意艺术、虚拟场景构建及广告内容生成等领域，具备良好的兼容性和性能优势。

AI项目与工具 2025年06月12日 32 点赞 0 评论 744 浏览

FramePainter

FramePainter

FramePainter 是一款基于AI的交互式图像编辑工具，结合视频扩散模型与草图控制技术，支持用户通过简单操作实现精准图像修改。其核心优势包括高效训练机制、强泛化能力及高质量输出。适用于概念艺术、产品展示、社交媒体内容创作等场景，具备低训练成本和自然的图像变换能力。

AI项目与工具 2025年06月12日 70 点赞 0 评论 532 浏览

StoryWeaver

StoryWeaver

StoryWeaver是一款基于AI的故事可视化工具，利用知识图谱Character Graph和创新技术如CCG及KE-SG，实现高质量的角色定制和故事图像生成。它支持单角色与多角色场景，确保图像与文本语义的一致性，并适用于教育、漫画创作、游戏设计等多个领域。

AI项目与工具 2025年06月12日 27 点赞 0 评论 902 浏览

DiTCtrl

DiTCtrl

DiTCtrl是一种基于多模态扩散变换器架构的视频生成工具，能够利用多个文本提示生成连贯且高质量的视频内容，无需额外训练即可实现零样本多提示视频生成。它通过KV共享和潜在混合策略优化不同提示间的平滑过渡，同时在MPVBench基准上表现出色，适用于电影、游戏、广告及新闻等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 733 浏览

MV

MV-Adapter是一款基于文本到图像扩散模型的多视图一致图像生成工具，通过创新的注意力机制和条件编码器，实现了高分辨率多视角图像生成。其核心功能包括多视图图像生成、适配定制模型、3D模型重建以及高质量3D贴图生成，适用于2D/3D内容创作、虚拟现实、自动驾驶等多个领域。

AI项目与工具 2025年06月12日 23 点赞 0 评论 624 浏览

ColorFlow

ColorFlow

ColorFlow是一款由清华大学与腾讯ARC实验室联合研发的图像序列着色模型，具备检索增强、上下文学习及超分辨率技术，能够精准保持个体身份并实现高质量着色。该工具在漫画、动画制作、老照片修复及艺术创作等领域具有广泛应用价值，同时支持学术研究和技术探索。

AI项目与工具 2025年06月12日 96 点赞 0 评论 865 浏览

Leffa

Leffa

Leffa是一种基于注意力机制的可控人物图像生成框架，通过流场学习精确控制人物的外观和姿势。其核心技术包括正则化损失函数、空间一致性及模型无关性，能够在保持细节的同时提升图像质量。Leffa广泛应用于虚拟试穿、增强现实、游戏开发及影视后期制作等领域，展现出卓越的性能与灵活性。

AI项目与工具 2025年06月12日 18 点赞 0 评论 629 浏览

微信公众账号

微信扫一扫加关注