生成 - 智狐AI导航

万相首尾帧模型

万相首尾帧模型（Wan2.1-FLF2V-14B）是一款开源视频生成工具，基于DiT架构和交叉注意力机制，可根据用户提供的首帧和尾帧图像生成高质量、流畅的过渡视频。支持多种风格和特效，适用于创意视频制作、影视特效、广告营销等多个场景。模型具备细节复刻、动作自然、指令控制等功能，且提供GitHub和HuggingFace开源资源供用户使用。

AI项目与工具 2025年06月11日 100 点赞 0 评论 787 浏览

InstantCharacter

InstantCharacter是由腾讯混元开发的图像生成插件，基于扩散 Transformer 架构，支持角色一致性保持、高保真图像生成及文本可控性。用户可通过输入角色图片和文字描述，生成符合要求的多样化图像。其适用于连环画、影视、游戏等多个领域，具有高效、灵活和高质量的特点。

AI项目与工具 2025年06月11日 94 点赞 0 评论 633 浏览

AI材料星

AI材料星是一款基于AI技术的公文写作辅助平台，支持生成多种类型的高质量公文内容，具备AI纠错、原创度检测、PPT生成等功能。平台提供丰富的范文和金句资源，适用于政府、企业及学术研究场景，提升写作效率与规范性。

AI项目与工具 2025年06月11日 36 点赞 0 评论 663 浏览

FramePack

FramePack 是斯坦福大学推出的开源 AI 视频生成模型，通过帧上下文打包和抗漂移采样技术，实现高效、稳定的视频生成。其仅需 6GB 显存即可运行，支持实时高清视频生成，具备灵活的调度策略，适用于多种应用场景，如短视频制作、游戏开发、教育与广告等，显著降低了视频生成的硬件门槛。

AI项目与工具 2025年06月11日 23 点赞 0 评论 890 浏览

MineWorld

MineWorld是由微软研究院开发的基于《我的世界》的实时交互式AI模型，采用视觉-动作自回归Transformer架构，实现高保真、可控性强的场景生成。通过并行解码算法，模型可在每秒4至7帧的速度下实现实时交互，适用于具身智能、强化学习、游戏代理及视频生成等场景。其核心技术包括图像与动作标记器、Transformer解码器以及优化的训练与推理流程。

AI项目与工具 2025年06月11日 93 点赞 0 评论 856 浏览