训练

LLM Engineer Toolkit

一个精心整理的LLM工具库,它将120多个与LLM相关的库按照功能和用途进行了细致分类,涵盖了从训练微调、应用开发、推理服务到安全评估等 LLM 开发全流程所需的工具。

OpenMath

OpenMath-Nemotron是由英伟达推出的一系列开源数学推理模型,专为解决复杂数学问题设计,涵盖从基础到奥林匹克级别的题目。其基于大规模数据集OpenMathReasoning训练,具备长推理、多模式推理和工具集成推理能力。模型支持多种应用场景,包括数学教育、竞赛训练、学术研究和工业应用。项目提供GitHub、HuggingFace和arXiv等资源,适用于需要高精度数学推理的AI系统开发

GameGen

GameGen-O 是一款基于 Transformer 架构的AI工具,专注于开放世界游戏视频的生成。它具备角色生成、环境构建、动作模拟及交互式控制等功能,通过两阶段训练方法提升了生成质量和灵活性,可应用于游戏原型设计、场景生成及开发辅助等领域,有助于降低开发成本并提高创作效率。

ModelEngine

ModelEngine 是华为开源的全流程 AI 开发工具链,涵盖数据处理、模型训练与应用开发三大核心模块。支持多模态数据清洗、知识向量化及模型推理,提供低代码编排和 RAG 框架,适用于医疗、金融、制造等领域的 AI 应用开发与行业化落地。

Promptriever

Promptriever是一款基于自然语言处理的新型检索模型,融合了大型语言模型提示技术与信息检索优势。它通过双编码器架构及指令训练集优化,实现了对复杂查询的高度适应性与鲁棒性,适用于搜索引擎优化、智能助手、企业内部搜索及学术研究等多个领域。

AReaL

AReaL-boba 是由蚂蚁技术研究院与清华大学联合推出的开源强化学习训练框架,具备高效训练、推理能力提升、低资源训练等核心功能。其 7B 模型在数学推理任务中表现突出,且支持大规模模型的低成本复现。框架集成 SGLang 推理系统,采用数据蒸馏与工程优化技术,提升训练效率。适用于教育、自然语言处理、智能体开发等领域,具有高度可复现性和开源特性。

OLMoE

OLMoE是一款基于混合专家(MoE)架构的开源大型语言模型,具有高效的稀疏激活机制和快速训练能力。它支持自然语言理解、文本生成、多任务处理等功能,并广泛应用于聊天机器人、内容创作、情感分析和问答系统等领域,通过预训练和微调实现高精度任务执行。 ---

Tarsier2

Tarsier2是字节跳动研发的大规模视觉语言模型,擅长生成高精度视频描述并在多项视频理解任务中表现优异。其核心技术包括大规模数据预训练、细粒度时间对齐微调以及直接偏好优化(DPO)。该模型在视频问答、定位、幻觉检测及具身问答等任务中均取得领先成绩,支持多语言处理,具有广泛的应用潜力。

VideoVAE+

VideoVAE+是一种由香港科技大学研发的跨模态视频变分自编码器,具备时空分离压缩和文本指导功能。它通过分离空间与时间信息处理,有效减少运动伪影,同时利用文本嵌入增强细节重建能力。VideoVAE+在视频重建质量上超越现有模型,支持高保真与跨模态重建,适用于视频压缩、影视后期制作及在线教育等多个领域。