推理 - 智狐AI导航

MVoT

MVoT是一种多模态推理框架，通过生成图像形式的推理痕迹，增强多模态大语言模型在复杂空间推理任务中的表现。其核心技术包括多模态推理范式、token discrepancy loss以及递归生成机制，有效提升推理准确性和可解释性。该工具适用于机器人导航、自动驾驶、智能教育、医疗影像分析及VR/AR交互等多个领域，具有广泛的应用潜力。

AI项目与工具 2025年06月12日 57 点赞 0 评论 731 浏览

AgentRefine

AgentRefine 是由北京邮电大学与美团联合开发的智能体合成框架，采用“精炼调整”方法提升基于大语言模型的智能体在多样化任务中的泛化能力。它通过轨迹中的观察实现错误纠正与自我优化，增强智能体在复杂环境中的适应性和鲁棒性。该框架支持多样化推理路径，广泛应用于自动化决策、游戏 AI、代码生成及自然语言处理等领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 732 浏览

Bamba

Bamba-9B是一种基于Mamba2架构的解码型语言模型，专注于提升大型语言模型的推理效率，尤其擅长处理长文本。它通过恒定的KV-cache设计解决了内存带宽瓶颈问题，并在多个开源平台上得到支持。Bamba-9B不仅具有高效的吞吐量和低延迟的特点，还支持模型量化及长上下文长度扩展，适用于多种应用场景，包括机器翻译、智能客服、内容推荐、自动摘要和社会媒体监控等。

AI项目与工具 2025年06月12日 26 点赞 0 评论 733 浏览

SFR-RAG

先进的大型语言模型，它通过强化对上下文的理解，提高了机器在生成文本方面的准确性和可靠性。无论是在客户服务、知识问答、内容创作还是专业咨询领域，SFR-RAG都能提供高质量的文...

Ai平台模型 2026年06月21日 0 点赞 0 评论 733 浏览

Step

覆盖了从个人使用到企业级应用的多个方面的多模态大模型。

创作工具 2026年06月21日 0 点赞 0 评论 735 浏览

Phi-3是由微软研究院开发的一系列小型语言模型，包括phi-3-mini、phi-3-small和phi-3-medium三个版本。这些模型通过优化的数据集和算法，在保持较小参数规模的同时，展现出与大型模型相当的语言理解和推理能力。phi-3-mini模型仅有3.8亿参数，但在多项基准测试中表现优异，甚至能在智能手机上运行。Phi-3系列模型的研发体现了在数据工程和模型优化领域的最新进展，为未来

AI项目与工具 2024年01月01日 42 点赞 0 评论 740 浏览

QwQ

QwQ-32B-Preview是一款由阿里巴巴开发的开源AI推理模型，具有325亿参数，擅长处理数学与编程领域的复杂任务。它能在多个基准测试中超越同类产品，并提供透明化的推理流程。然而，该模型在语言切换及跨领域应用上存在一定局限性。

AI项目与工具 2025年06月12日 99 点赞 0 评论 741 浏览

Gemini

Gemini是Google DeepMind推出的全新AI模型，集成了多模态推理功能，超越了以往模型的性能，适用于科学文献洞察、竞争性编程等多种应用场景。

Ai平台模型 2025年06月05日 100 点赞 0 评论 741 浏览

MiniCPM

MiniCPM-o 2.6 是一款高性能的多模态大模型，具备 8B 参数量，支持视觉、语音及多模态直播等多种功能。其在图像处理、语音识别和实时交互方面表现优异，采用高效的 token 技术提升推理速度，可在端侧设备上运行。支持多种语言和音色配置，适用于智能助手、内容创作、教育、客服和医疗等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 742 浏览

LEOPARD

LEOPARD是一款由腾讯AI Lab开发的视觉语言模型，专为处理包含大量文本的多图像任务而设计。它通过自适应高分辨率多图像编码模块和大规模多模态指令调优数据集，实现对复杂视觉语言任务的高效处理，包括跨图像推理、高分辨率图像处理及动态视觉序列长度优化。LEOPARD在自动化文档理解、教育、商业智能等领域具有广泛应用潜力。

AI项目与工具 2025年06月12日 35 点赞 0 评论 745 浏览

推理

首页

推理

列表

默认

浏览次数

发布日期