架构 - 智狐AI导航

豆包AI视频模型

豆包AI视频模型包括PixelDance和Seaweed两款工具，分别基于DiT和Transformer架构。PixelDance擅长处理复杂指令和多主体互动，适合制作情节丰富的短片；Seaweed支持多分辨率输出，生成高质量、高逼真的视频，适用于商业领域。两者均提供多样化的风格选择和输出格式，满足不同场景需求。 ---

AI项目与工具 2025年06月12日 45 点赞 0 评论 651 浏览

BrushNet

BrushNet是一款基于扩散模型的图像修复工具，采用双分支架构处理遮罩区域。它能够实现像素级修复，保持修复区域与原始图像的一致性和高质量。BrushNet适用于多种场景和风格的图像，包括人类、动物、室内和室外场景，以及自然图像、铅笔画、动漫、插画和水彩画等。通过与预训练扩散模型结合，BrushNet提供灵活的修复控制，同时保留未遮罩区域的细节。

AI项目与工具 2024年01月01日 55 点赞 0 评论 647 浏览

Mochi 1

Mochi 1 是一款基于开源架构的 AI 视频生成工具，具有高保真度和强大的提示遵循能力。它采用 Genmo 自研的非对称扩散变压器（AsymmDiT）架构，结合实时视频生成技术和流式架构，能够高效生成高质量的视频内容。Mochi 1 支持多种应用场景，包括视频内容创作、教育、娱乐、广告和社交媒体等，适用于个人和企业用户。

AI项目与工具 2025年06月12日 27 点赞 0 评论 645 浏览

LLM Course

一个关于LLMs课程的集合，包含学习路线图和Colab笔记本，帮助用户从基础到高级逐步掌握LLMs的知识和应用。

Ai学习资源 2025年06月05日 85 点赞 0 评论 640 浏览

Xmind

Xmind是一款非常实用的商业思维导图软件，应用全球最先进的Eclipse RCP 软件架构，全力打造易用、高效的可视化思维软件。致力于使用先进的软件技术帮助用户真正意义上提高生产率。

思维导图 2025年06月05日 64 点赞 0 评论 637 浏览

Veo是Google DeepMind开发的一款视频生成模型，用户可以通过文本、图像或视频提示来指导其生成所需的视频内容。Veo具备深入的自然语言理解能力，能够准确解析用户的文本提示，生成高质量、高分辨率的视频。其主要功能包括高分辨率视频输出、自然语言处理、风格适应性、创意控制与定制、遮罩编辑功能、参考图像与风格应用、视频片段的剪辑与扩展以及视觉连贯性。Veo技术目前仍处于实验阶段，但已在电影制作

AI项目与工具 2024年01月01日 34 点赞 0 评论 633 浏览

SWAPP

SWAPP 是建筑行业中的一个突破性工具，它通过 AI 技术帮助建筑团队提高工作效率和文档质量。通过个性化的规则和算法，SWAPP 能够自动化地创建和注释建筑文档，同时保持对数据安全...

创作工具 2026年06月22日 0 点赞 0 评论 628 浏览

xLAM

xLAM 是 Salesforce 开源的一款大型语言模型，专为功能调用任务设计。该模型具备多语言支持、预训练模型、迁移学习、自然语言处理等主要功能，并基于 Transformer 架构实现。它在多个基准测试中表现出色，适用于自动化任务、模板共享、插件开发和教育等多个应用场景。

AI项目与工具 2025年06月12日 55 点赞 0 评论 627 浏览

EXAONE 3.5

EXAONE 3.5是一款由LG AI研究院开发的开源AI模型，包含多种参数规模版本，专长于长文本处理和复杂场景下的推理任务。其核心技术包括检索增强生成与多步推理，可显著减少错误信息并提升准确性。此外，EXAONE 3.5还具备双语支持及强大的上下文理解能力，适用于聊天机器人、语言翻译、内容创作等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 624 浏览

Molmo 72B

Molmo 72B是一款由艾伦人工智能研究所推出的开源多模态AI模型，集成了图像和文本处理能力，适用于图像描述生成、视觉问答、文档解析及多模态交互等多种任务。凭借其强大的视觉编码能力和先进的模型架构，Molmo 72B在学术基准测试中表现优异，为开源AI技术的发展做出了重要贡献。

AI项目与工具 2025年06月12日 69 点赞 0 评论 623 浏览

架构

首页

架构

列表

默认

浏览次数

发布日期