模型 - 智狐AI导航

Eagle

Eagle是一个由英伟达开发的多模态大模型，专长于处理高分辨率图像，提高视觉问答和文档理解能力。该模型采用多专家视觉编码器架构，通过简单的特征融合策略实现图像内容的深入理解。Eagle模型已开源，适用于多个行业，具有高分辨率图像处理、多模态理解、多专家视觉编码器、特征融合策略和预对齐训练等特点。

AI项目与工具 2025年06月12日 38 点赞 0 评论 602 浏览

Oryx

Oryx是一款由清华大学、腾讯和南洋理工大学联合开发的多模态大型语言模型，专为处理视觉数据设计。其核心技术包括预训练的OryxViT模型和动态压缩模块，支持任意分辨率的图像处理及高效的视觉数据压缩。Oryx在空间和时间理解上表现优异，广泛应用于智能监控、自动驾驶、人机交互、内容审核、视频编辑及教育等领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 602 浏览

Awesome MCP ZH

一个专为中文用户打造的 MCP资源合集！包括有 MCP 的基础介绍、玩法、客户端、服务器和社区资源，帮你快速上手这个 AI 界的“万能插头”。

Ai学习资源 2025年06月05日 40 点赞 0 评论 601 浏览

OmniParser

OmniParser是一款由微软研究院开发的屏幕解析工具，能够将UI截图转换为结构化数据，通过识别可交互图标和提取功能语义，提升基于大型语言模型的UI代理系统的性能。它支持跨平台应用，无需依赖额外信息，适用于自动化软件测试、虚拟助手、辅助技术等多个领域。

AI项目与工具 2025年06月12日 29 点赞 0 评论 600 浏览

书生·筑梦2.0（Vchitect 2.0）

书生·筑梦2.0是一款由上海人工智能实验室开发的开源视频生成大模型，支持文本到视频和图像到视频的转换，生成高质量的2K分辨率视频内容。它具备灵活的宽高比选择、强大的超分辨率处理能力以及创新的视频评测框架，适用于广告、教育、影视等多个领域。

AI项目与工具 2025年06月12日 32 点赞 0 评论 599 浏览

Skyvern

Skyvern是一款基于开源的浏览器自动化工具，集成了大型语言模型和计算机视觉技术，用于实现网页内容解析、交互计划生成及执行。其主要功能涵盖CAPTCHA解决、双因素认证支持、代理网络配置、可解释AI操作以及数据提取等，适用于网站数据抓取、表单填写、网页测试等多种应用场景。

AI项目与工具 2025年06月12日 90 点赞 0 评论 599 浏览

Lepton AI

Lepton AI是由贾扬清创办的云原生AI平台，提供了一系列工具和服务，降低AI应用开发的门槛，帮助开发者更容易地完成创建、部署和扩展任务。它提供了 Python SDK 和云计算平台。Pyth...

创作工具 2026年06月22日 0 点赞 0 评论 599 浏览

VideoJAM

VideoJAM是Meta开发的视频生成框架，旨在提升视频运动连贯性。通过联合学习外观与运动信息，在训练阶段同时预测像素和运动特征，并在推理阶段利用动态引导机制优化生成结果。该技术具备高度通用性，可适配多种视频生成模型，无需调整训练数据或模型结构，已在多项基准测试中表现优异，适用于影视、游戏、教育等多个领域。

AI项目与工具 2025年06月12日 37 点赞 0 评论 599 浏览

小白研报

基于元石自研模型，让小白研报模拟人类思维，通过多轮思考与工具调用，自动生成论文、行业研究与趋势报告，并以精美可视化网页呈现出来。

AI写作对话 2025年06月05日 40 点赞 0 评论 599 浏览

OmniManip

OmniManip是由北京大学与智元机器人联合实验室开发的通用机器人操作框架，结合视觉语言模型与三维操作技术，实现机器人在非结构化环境中的任务执行。其核心为以对象为中心的交互基元表示法，支持零样本泛化、跨平台部署及大规模仿真数据生成。通过双闭环系统设计与任务分解机制，提升操作精度与适应性，适用于日常操作、工业自动化及服务机器人等场景。

AI项目与工具 2025年06月12日 53 点赞 0 评论 599 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期