模型 - 智狐AI导航

LaDeCo

LaDeCo是一款基于多模态模型的自动化图形设计工具，通过分层规划与逐步生成的方式，实现从多模态输入到高质量设计输出的转换。其核心功能涵盖层规划、层级设计生成、分辨率调整、元素填充及多样化设计输出，广泛适用于设计师、研究人员、评估人员及开发者等群体，助力提升设计效率与质量。

AI项目与工具 2025年06月12日 53 点赞 0 评论 524 浏览

AutoRAG

AutoRAG是一款由中科院相关机构研发的自主迭代检索模型，专为大型语言模型设计，通过多轮对话实现检索规划与查询细化，具备动态调整迭代次数、增强可解释性的特点。它在复杂任务处理方面表现出色，支持智能问答、学术研究、市场分析、在线教育及客户服务等多样化应用场景。 ---

AI项目与工具 2025年06月12日 41 点赞 0 评论 630 浏览

OpenEMMA

OpenEMMA是一个开源的端到端自动驾驶多模态模型框架，基于预训练的多模态大型语言模型（MLLMs），能够处理视觉数据和复杂驾驶场景的推理任务。它通过链式思维推理机制提升轨迹规划和感知任务性能，并集成了优化的YOLO模型以提高3D边界框预测的准确性。此外，OpenEMMA支持人类可读的输出，适用于多种驾驶环境，包括城市道路、高速公路、夜间及复杂天气条件下的驾驶。

AI项目与工具 2025年06月12日 36 点赞 0 评论 820 浏览

Tennr

Tennr是一款利用AI技术优化医疗文档处理的平台，核心为RaeLM™视觉语言模型，支持文档分类、信息提取、资格审核等功能，广泛应用于患者入院、转诊管理、保险索赔等场景，显著提高医疗服务效率并降低人力依赖。

AI项目与工具 2025年06月12日 93 点赞 0 评论 540 浏览

Psi R0

Psi R0是一款基于强化学习的端到端具身模型，支持双灵巧手协同操作，具备多技能串联混训和跨物品、跨场景的泛化能力。通过仿真数据训练及技能优化，Psi R0能在复杂环境中完成长程任务，同时具备自主切换技能的功能，确保高成功率和鲁棒性。主要应用场景包括电商商品打包、工厂产线组装、服务业拣货打包及家居环境清洁整理。

AI项目与工具 2025年06月12日 18 点赞 0 评论 840 浏览

探一下

探一下是一款依托于多模态大模型技术的AI视觉搜索工具，用户可通过其摄像头识别花草、宠物、潮玩等物体，获取旅游讲解、商品药品详情等信息，同时具备趣味解读图片的功能，支持文字翻译与场景触发滤镜，适用于多种生活场景。 ---

AI项目与工具 2025年06月12日 47 点赞 0 评论 817 浏览

琅琊

琅琊是中国科学院海洋研究所推出的一款海洋人工智能大模型，专注于全球海洋状态变量的中短期高精度预报。它采用先进的机器学习技术与海洋科学知识相结合的方式，提供1至7天的温度、盐度和海流等关键指标的高分辨率预报，显著提高海洋预报的准确性与可靠性。未来版本将扩展至更多复杂海洋现象的预测，增强灾害预警能力。 ---

AI项目与工具 2025年06月12日 12 点赞 0 评论 682 浏览

Mind GPT

Mind GPT-3o是一款由理想汽车推出的大规模多模态端到端人工智能模型，集成了语音、视觉与语言理解技术，具备记忆、规划、工具集成及表达能力。它不仅能理解复杂信息，还能提供个性化服务，如智能驾驶辅助、家居设备控制、日程管理和健康咨询等。通过强化逻辑推理与上下文理解，该模型实现了从感知到表达的智能化跨越，为用户提供全面的支持。

AI项目与工具 2025年06月12日 65 点赞 0 评论 856 浏览

SPAR

SPAR是一种自我博弈框架，专为增强大型语言模型的指令遵循能力设计。它通过生成者和完善者的角色互动，利用树搜索技术和迭代优化，提升模型的自我完善能力。实验显示，SPAR在多个基准测试中表现出色，适用于智能助手、客户服务、教育技术及医疗咨询等多个应用场景。

AI项目与工具 2025年06月12日 64 点赞 0 评论 591 浏览

Vision Parse

Vision Parse 是一款开源工具，旨在通过视觉语言模型将 PDF 文件转换为 Markdown 格式。它具备智能识别和提取 PDF 内容的能力，包括文本和表格，并能保持原有格式与结构。此外，Vision Parse 支持多种视觉语言模型，确保解析的高精度与高速度。其应用场景广泛，涵盖学术研究、法律文件处理、技术支持文档以及电子书制作等领域。

AI项目与工具 2025年06月12日 72 点赞 0 评论 617 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期