模型 - 智狐AI导航

Eagle

Eagle是一个由英伟达开发的多模态大模型，专长于处理高分辨率图像，提高视觉问答和文档理解能力。该模型采用多专家视觉编码器架构，通过简单的特征融合策略实现图像内容的深入理解。Eagle模型已开源，适用于多个行业，具有高分辨率图像处理、多模态理解、多专家视觉编码器、特征融合策略和预对齐训练等特点。

AI项目与工具 2025年06月12日 38 点赞 0 评论 602 浏览

Oryx

Oryx是一款由清华大学、腾讯和南洋理工大学联合开发的多模态大型语言模型，专为处理视觉数据设计。其核心技术包括预训练的OryxViT模型和动态压缩模块，支持任意分辨率的图像处理及高效的视觉数据压缩。Oryx在空间和时间理解上表现优异，广泛应用于智能监控、自动驾驶、人机交互、内容审核、视频编辑及教育等领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 602 浏览

Awesome MCP ZH

一个专为中文用户打造的 MCP资源合集！包括有 MCP 的基础介绍、玩法、客户端、服务器和社区资源，帮你快速上手这个 AI 界的“万能插头”。

Ai学习资源 2025年06月05日 40 点赞 0 评论 602 浏览

OmniParser

OmniParser是一款由微软研究院开发的屏幕解析工具，能够将UI截图转换为结构化数据，通过识别可交互图标和提取功能语义，提升基于大型语言模型的UI代理系统的性能。它支持跨平台应用，无需依赖额外信息，适用于自动化软件测试、虚拟助手、辅助技术等多个领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 601 浏览

Skyvern

Skyvern是一款基于开源的浏览器自动化工具，集成了大型语言模型和计算机视觉技术，用于实现网页内容解析、交互计划生成及执行。其主要功能涵盖CAPTCHA解决、双因素认证支持、代理网络配置、可解释AI操作以及数据提取等，适用于网站数据抓取、表单填写、网页测试等多种应用场景。

AI项目与工具 2025年06月12日 90 点赞 0 评论 601 浏览

VideoJAM

VideoJAM是Meta开发的视频生成框架，旨在提升视频运动连贯性。通过联合学习外观与运动信息，在训练阶段同时预测像素和运动特征，并在推理阶段利用动态引导机制优化生成结果。该技术具备高度通用性，可适配多种视频生成模型，无需调整训练数据或模型结构，已在多项基准测试中表现优异，适用于影视、游戏、教育等多个领域。

AI项目与工具 2025年06月12日 37 点赞 0 评论 601 浏览

书生·筑梦2.0（Vchitect 2.0）

书生·筑梦2.0是一款由上海人工智能实验室开发的开源视频生成大模型，支持文本到视频和图像到视频的转换，生成高质量的2K分辨率视频内容。它具备灵活的宽高比选择、强大的超分辨率处理能力以及创新的视频评测框架，适用于广告、教育、影视等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 599 浏览

BFS

BFS-Prover 是一种基于大语言模型的自动定理证明系统，通过改进广度优先搜索算法和长度归一化评分机制，提高证明搜索效率。系统结合专家迭代、直接偏好优化和分布式架构，支持复杂定理的高效验证，并与 Lean4 深度集成，确保形式化数学问题的逻辑正确性。适用于数学竞赛题、本科及研究生数学研究等领域，推动了自动定理证明技术的发展。

AI项目与工具 2025年06月12日 75 点赞 0 评论 599 浏览

Lepton AI

Lepton AI是由贾扬清创办的云原生AI平台，提供了一系列工具和服务，降低AI应用开发的门槛，帮助开发者更容易地完成创建、部署和扩展任务。它提供了 Python SDK 和云计算平台。Pyth...

创作工具 2026年06月22日 0 点赞 0 评论 599 浏览

小白研报

基于元石自研模型，让小白研报模拟人类思维，通过多轮思考与工具调用，自动生成论文、行业研究与趋势报告，并以精美可视化网页呈现出来。

AI写作对话 2025年06月05日 40 点赞 0 评论 599 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期