强化学习 - 智狐AI导航

DeepMesh

DeepMesh是由清华大学和南洋理工大学研发的3D网格生成框架，结合强化学习与自回归变换器技术，实现高质量、高精度的3D模型生成。支持点云和图像条件输入，具备高效的预训练策略与人类偏好对齐机制，适用于虚拟环境、角色动画、医学模拟及工业设计等多个领域。

AI项目与工具 2025年06月12日 98 点赞 0 评论 496 浏览

悟道·天鹰（Aquila）

悟道·天鹰（Aquila）是智源研究院开源的中英双语语言大模型，具备强大的语言理解和生成能力。模型在设计上注重商用和数据合规性，同时提供持续的开源更新和技术支持。

Ai平台模型 2026年06月21日 0 点赞 0 评论 489 浏览

DeepEyes

DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型，基于端到端强化学习实现“用图思考”能力，无需依赖监督微调。它在推理过程中动态调用图像工具，增强对细节的感知与理解，在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能，适用于教育、医疗、交通、安防和工业等多个领域。

AI项目与工具 2025年06月11日 21 点赞 0 评论 482 浏览

Deep Research Web UI

Deep Research Web UI 是一款开源 AI 研究助手，支持多轮次搜索、树状可视化研究路径、多语言处理及数据导出功能。具备智能搜索、数据分析、报告生成能力，适用于文献综述、市场调研等场景。工具可在浏览器端运行，保障隐私安全，并兼容多种 AI 模型，支持本地部署与自定义配置。

AI项目与工具 2025年06月12日 87 点赞 0 评论 450 浏览

网易·伏羲

网易伏羲是网易旗下专业从事游戏与泛娱乐AI研究和应用的顶尖机构。专注于数字孪生、强化学习、用户画像、自然语言处理、分布式引擎等多个领域的技术创新，提供“瑶台”沉浸式虚拟活...

Ai科技公司 2026年06月21日 0 点赞 0 评论 351 浏览

MaskSearch

MaskSearch是阿里巴巴通义实验室推出的新型通用预训练框架，通过检索增强掩码预测（RAMP）任务提升大型语言模型（LLM）的智能体搜索能力。该工具利用外部知识库和搜索工具预测被掩盖的关键信息，增强模型对复杂问题的理解和回答能力。结合SFT和强化学习（RL）训练方法，采用多智能体协同生成思维链数据，并引入课程学习策略优化模型性能。适用于智能客服、教育、企业搜索及机器学习模型调试等多个场景。

摄影壁纸 2025年06月11日 46 点赞 0 评论 190 浏览

强化学习

首页

强化学习

列表

默认

浏览次数

发布日期

DeepMesh

悟道·天鹰（Aquila）

DeepEyes

Deep Research Web UI

网易·伏羲

MaskSearch

强化学习 首页 强化学习

列表 默认 浏览次数 发布日期

DeepMesh

悟道·天鹰（Aquila）

DeepEyes

Deep Research Web UI

网易·伏羲

MaskSearch

强化学习

首页

强化学习

列表

默认

浏览次数

发布日期