模型

WebWalker

WebWalker是阿里巴巴研发的AI工具,用于评估和优化大型语言模型在网页浏览任务中的表现。它通过多智能体框架、垂直探索策略及WebWalkerQA数据集,提升模型处理长上下文和多源信息的能力。支持多语言、多领域和多难度任务,适用于信息检索、数据分析和内容监控等场景,具备良好的适应性和可扩展性。

Proactive Agent

Proactive Agent是一款由清华大学主导开发的主动式AI代理系统,它通过观察环境和用户行为来预测需求并自主发起任务,无需依赖明确指令即可完成操作。主要功能包括环境感知、上下文理解、任务执行及用户互动优化等。此外,该系统采用先进的环境模拟技术和奖励机制进行训练与评估,广泛应用于个人助理、文件管理、生活服务等多个领域。

Promptriever

Promptriever是一款基于自然语言处理的新型检索模型,融合了大型语言模型提示技术与信息检索优势。它通过双编码器架构及指令训练集优化,实现了对复杂查询的高度适应性与鲁棒性,适用于搜索引擎优化、智能助手、企业内部搜索及学术研究等多个领域。

Resume Matcher

Resume Matcher 是一个免费的开源项目,专门为开发者设计,以简化简历创建过程并加速求职搜索。

AReaL

AReaL-boba 是由蚂蚁技术研究院与清华大学联合推出的开源强化学习训练框架,具备高效训练、推理能力提升、低资源训练等核心功能。其 7B 模型在数学推理任务中表现突出,且支持大规模模型的低成本复现。框架集成 SGLang 推理系统,采用数据蒸馏与工程优化技术,提升训练效率。适用于教育、自然语言处理、智能体开发等领域,具有高度可复现性和开源特性。

Hyper

Hyper-SD是由字节跳动研究人员开发的高效图像合成框架,通过轨迹分割一致性蒸馏(TSCD)、人类反馈学习(ReFL)和分数蒸馏等技术,显著降低了扩散模型在多步推理过程中的计算成本。该框架在保持高图像质量的同时,大幅减少了推理步骤,实现了快速生成高分辨率图像,推动了生成式AI技术的发展。

CHRONOS

CHRONOS是由上海交通大学与阿里巴巴集团联合开发的新闻时间线生成框架,基于大型语言模型(LLMs)实现开放域与封闭域的时间线构建。其核心机制包括迭代自问自答、问题重写与分而治之策略,能够高效处理信息过载与数据噪声,生成结构清晰、逻辑连贯的事件摘要。适用于新闻整理、金融分析、政府决策、教育研究及品牌宣传等多个领域。

OpenMath

OpenMath-Nemotron是由英伟达推出的一系列开源数学推理模型,专为解决复杂数学问题设计,涵盖从基础到奥林匹克级别的题目。其基于大规模数据集OpenMathReasoning训练,具备长推理、多模式推理和工具集成推理能力。模型支持多种应用场景,包括数学教育、竞赛训练、学术研究和工业应用。项目提供GitHub、HuggingFace和arXiv等资源,适用于需要高精度数学推理的AI系统开发

ModelEngine

ModelEngine 是华为开源的全流程 AI 开发工具链,涵盖数据处理、模型训练与应用开发三大核心模块。支持多模态数据清洗、知识向量化及模型推理,提供低代码编排和 RAG 框架,适用于医疗、金融、制造等领域的 AI 应用开发与行业化落地。

DELIFT

DELIFT是一种针对大型语言模型微调的数据优化算法,通过成对效用度量与次模优化技术,有效减少数据量需求,同时维持甚至提升模型性能。它适用于指令调优、任务特定微调及持续微调三个关键阶段,并具备高计算效率和广泛适用性,广泛应用于数据科学家、研究人员及教育工作者等领域。