推理 - 智狐AI导航

Agent K v1.0

Agent K v1.0 是一款端到端自主数据科学智能体，由华为诺亚方舟实验室与伦敦大学学院团队联合开发。该工具能够自动化处理数据科学生命周期中的各个环节，支持多模态数据处理，具备动态多步骤问题解决能力，并通过结构化推理和动态记忆管理实现自我学习与优化。Agent K v1.0 在Kaggle多模态挑战赛中表现优异，广泛应用于金融、医疗、零售、制造及客户服务等领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 751 浏览

Embodied Reasoner

Embodied Reasoner是由多家科研机构联合开发的具身交互推理模型，通过视觉搜索、推理与行动协同完成复杂任务。采用模仿学习、自我探索和自我修正三阶段训练方法，生成多样化思考过程，提升任务规划效率。在长时序任务中表现优异，减少重复搜索和逻辑错误。适用于智能家居、仓储物流、医疗辅助等多个场景，具备多模态交互和强推理能力。

AI项目与工具 2025年06月11日 88 点赞 0 评论 752 浏览

RAGEN

RAGEN是一款开源的强化学习框架，专为在交互式和随机环境中训练大型语言模型（LLM）推理代理而设计。它基于StarPO架构，支持多轮轨迹优化和多种强化学习算法，如PPO和GRPO。通过MDP形式化和渐进式奖励归一化策略，RAGEN提高了训练的稳定性和效率。其模块化设计支持多种环境，适用于智能对话、游戏AI、自动化推理等多个领域。

AI项目与工具 2025年06月11日 84 点赞 0 评论 756 浏览

AtomThink是一个由多所高校与企业联合研发的多模态数学推理框架，通过构建长链思维（CoT）引导多模态大型语言模型（MLLMs）进行复杂推理。它包含自动CoT注释引擎、原子步骤微调策略及多种搜索策略，旨在提升原子步骤质量并增强MLLMs的推理能力。AtomThink提出的大规模多模态数据集AtomMATH及其评估方法为模型训练和测试提供了重要支持，广泛应用于教育辅助、自动化测试、学术研究等领域

AI项目与工具 2025年06月12日 62 点赞 0 评论 763 浏览

OctoTools

OctoTools是斯坦福大学推出的开源智能体框架，通过标准化工具卡片实现复杂推理任务的高效处理。支持多步骤任务规划、工具集成与优化，具备高准确率和广泛适用性，适用于数学、医学、视觉分析等多个领域。

AI项目与工具 2025年06月12日 88 点赞 0 评论 764 浏览

ViDoRAG

ViDoRAG是阿里巴巴通义实验室联合高校开发的视觉文档检索增强生成框架，采用多智能体协作与动态迭代推理技术，提升复杂文档的检索与理解能力。通过高斯混合模型优化多模态信息整合，支持精准检索与高质量生成，适用于教育、金融、医疗等多个领域，显著提升文档处理效率与准确性。

AI项目与工具 2025年06月12日 26 点赞 0 评论 765 浏览

风声雨声

风声雨声是一款基于 GPT-3.5 的高质量翻译服务，能够适应各种语言和语境，拥有超强的上下文理解能力，实际的翻译效果远超 Google、DeepL 等同类型服务。

创作工具 2026年06月21日 0 点赞 0 评论 766 浏览

HuggingChat macOS

HuggingChat macOS是一款基于开源语言模型的聊天应用程序，专为macOS平台打造。它支持多款顶级开源大语言模型，具备网络搜索、代码高亮等功能，同时提供模型管理及本地推理引擎支持。这款工具适用于日常交流、信息查询、语言学习、编程辅助及内容创作等多种场景。

AI项目与工具 2025年06月12日 10 点赞 0 评论 766 浏览

商量智能助手

商汤科技研发的一款基于自然语言处理技术的人工智能大语言模型。它具备强大的语言理解和生成能力，能够高效地解答用户的问题，提供定制化建议，并辅助创作高质量文本。

AI写作对话 2025年06月05日 47 点赞 0 评论 767 浏览

SuperGPQA

SuperGPQA是由字节跳动豆包团队与M-A-P联合开发的知识推理基准测试集，覆盖285个研究生级学科，包含26529道题目。其核心功能是评估大语言模型的泛化能力和真实推理水平，42.33%的题目涉及数学计算或形式推理。该测试集采用专家与大语言模型协同构建的方式，确保题目质量，并涵盖STEM与非STEM领域，填补了长尾学科评估的空白。适用于模型性能评估、优化指导及跨学科研究等多种应用场景。

AI项目与工具 2025年06月12日 11 点赞 0 评论 768 浏览

推理

首页

推理

列表

默认

浏览次数

发布日期