DiT - 智狐AI导航

Qihoo

Qihoo-T2X是由360 AI研究院与中山大学联合研发的高效多模态生成模型，基于代理标记化扩散 Transformer（PT-DiT）架构。该模型通过稀疏代理标记注意力机制显著降低计算复杂度，支持文本到图像、视频及多视图生成。具备高效生成能力和多任务适应性，适用于创意设计、视频制作、教育、游戏开发及广告等多个领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 559 浏览

Linkeddit

Linkeddit 是一款基于 AI 技术的 Reddit 数据分析工具，能够根据用户需求智能匹配潜在客户、合作伙伴或目标受众。它提供用户画像分析、多维度筛选、实时数据更新等功能，帮助用户精准定位高价值用户。适用于市场营销、创业拓展、社区运营等场景，支持数据导出和长期使用，提升目标群体识别效率。

AI项目与工具 2025年06月12日 55 点赞 0 评论 498 浏览

万相首尾帧模型

万相首尾帧模型（Wan2.1-FLF2V-14B）是一款开源视频生成工具，基于DiT架构和交叉注意力机制，可根据用户提供的首帧和尾帧图像生成高质量、流畅的过渡视频。支持多种风格和特效，适用于创意视频制作、影视特效、广告营销等多个场景。模型具备细节复刻、动作自然、指令控制等功能，且提供GitHub和HuggingFace开源资源供用户使用。

AI项目与工具 2025年06月11日 100 点赞 0 评论 779 浏览

Step1X

Step1X-Edit 是由阶跃星辰团队推出的通用图像编辑框架，结合多模态大语言模型与扩散模型，支持多样化的图像编辑任务，如主体修改、背景更换、风格转换等。用户可通过自然语言指令进行操作，系统能精准理解并生成高质量图像。该工具基于大规模数据集训练，具备强大的真实场景适应能力，适用于创意设计、影视制作、社交媒体等多个领域。

AI项目与工具 2025年06月11日 81 点赞 0 评论 853 浏览

Cobra

Cobra是由清华大学、香港中文大学和腾讯ARC实验室联合开发的漫画线稿上色框架，采用因果稀疏注意力机制和局部可复用位置编码技术，实现高精度、高效率的自动上色。支持颜色提示调整，提升灵活性与个性化。适用于漫画、动画、插画等多种场景，具有高效的推理能力和良好的扩展性。项目已开源，包含技术论文与模型资源。

AI项目与工具 2025年06月11日 21 点赞 0 评论 731 浏览

SketchVideo

SketchVideo是一款基于草图和文本提示的视频生成与编辑框架，由多所高校与企业联合研发。它利用DiT模型和草图控制网络，实现对视频内容的精细控制，支持动态调整与细节保留。该工具适用于多种场景，如影视制作、教育、游戏开发等，具备高效生成与高质量输出能力。

AI项目与工具 2025年06月11日 83 点赞 0 评论 843 浏览

MTVCrafter是由中国科学院深圳先进技术研究院计算机视觉与模式识别实验室、中国电信人工智能研究所等机构推出的新型人类图像动画框架，基于4D运动标记化（4DMoT）和运动感知视频扩散Transformer（MV-DiT）实现高质量动画生成。该工具直接对3D运动序列建模，支持泛化到多种角色和风格，保持身份一致性，并在TikTok基准测试中取得优异成绩。其应用场景包括数字人动画、虚拟试穿、沉浸式内

AI项目与工具 2025年06月11日 50 点赞 0 评论 671 浏览

Tripo3D AI

一个由VAST发布的在线3D建模平台，利用先进的AI技术，可以在几秒钟内生成高质量的3D模型。用户可以通过文本描述或上传图片来生成模型。

3D&游戏 2025年06月05日 63 点赞 0 评论 897 浏览

HypeAuditor

一款数据驱动型的影响力营销平台，帮助品牌和代理商寻找最佳红人，分析市场并跟踪和衡量红人的活动。

创业营销 2025年06月05日 10 点赞 0 评论 759 浏览

MagicEdit

MagicEdit 是字节跳动的一款视频编辑工具，它可以高保真度和时间连贯性地编辑视频，通过学习明确区分外观和动作。

Ai开源项目 2025年06月05日 40 点赞 0 评论 625 浏览

DiT

首页

DiT

列表

默认

浏览次数

发布日期