模型优化 - 智狐AI导航

SWEET

SWEET-RL是Meta开发的多轮强化学习框架，专为提升大型语言模型在协作推理任务中的表现而设计。通过引入训练时的额外信息优化“批评者”模型，实现精准的信用分配与策略优化。在ColBench基准测试中，其在后端编程和前端设计任务中表现出色，成功率提升6%。适用于文本校对、社交媒体审核、广告合规等多种场景，具备高度的通用性和适应性。

AI项目与工具 2025年06月12日 15 点赞 0 评论 590 浏览

AReaL

AReaL-boba 是由蚂蚁技术研究院与清华大学联合推出的开源强化学习训练框架，具备高效训练、推理能力提升、低资源训练等核心功能。其 7B 模型在数学推理任务中表现突出，且支持大规模模型的低成本复现。框架集成 SGLang 推理系统，采用数据蒸馏与工程优化技术，提升训练效率。适用于教育、自然语言处理、智能体开发等领域，具有高度可复现性和开源特性。

AI项目与工具 2025年06月12日 46 点赞 0 评论 278 浏览

Math24o

Math24o 是 SuperCLUE 开源的高中奥林匹克数学竞赛级别数学推理测评基准，基于 2024 年全国高中数学竞赛预赛试题，包含 21 道高难度解答题。评测通过程序自动判断答案一致性，客观评估模型正确率。支持自动化评估流程，适用于教育、学术研究和模型优化等领域，为数学推理能力的提升提供重要工具。

AI项目与工具 2025年06月12日 22 点赞 0 评论 308 浏览

DistilQwen2.5

DistilQwen2.5-R1 是阿里巴巴推出的基于知识蒸馏技术的轻量级深度推理模型，包含多种参数量级，适用于资源受限环境。它具备高效计算、深度推理和高度适应性，支持文本生成、机器翻译、客户服务等多种任务。通过双阶段训练和认知轨迹适配框架，提升了小模型的推理能力，性能优于同类开源模型。

AI项目与工具 2025年06月12日 92 点赞 0 评论 554 浏览

MetaStone

MetaStone-L1-7B 是一款轻量级推理模型，具备强大的数学和代码推理能力，性能达到行业领先水平。基于 DeepSeek-R1-Distill-Qwen-7B 架构，采用 GRPO 训练方式，支持多种计算架构并具备高效的云原生部署能力。适用于数学解题、编程辅助、智能客服、内容创作等多个场景，具有广泛的应用价值。

AI项目与工具 2025年06月12日 43 点赞 0 评论 600 浏览

赤兔Chitu

Chitu（赤兔）是清华大学与清程极智联合开发的高性能大模型推理引擎，支持多种GPU及国产芯片，打破对特定硬件的依赖。其具备全场景部署能力，支持低延迟、高吞吐、小显存优化，并在性能上优于部分国外框架。适用于金融风控、智能客服、医疗诊断、交通优化和科研等领域，提供高效、稳定的推理解决方案。

AI项目与工具 2025年06月12日 25 点赞 0 评论 350 浏览

APB是一种由清华大学等机构开发的分布式长上下文推理框架，通过稀疏注意力机制和序列并行推理提升大模型处理长文本的效率。采用更小的Anchor Block和Passing Block，结合查询感知的上下文压缩技术，减少计算开销并精准传递关键信息。在128K长度文本上，APB推理速度比Flash Attention快10倍，比Star Attention快1.6倍，适用于多种分布式环境和模型规模，广泛

AI项目与工具 2025年06月12日 64 点赞 0 评论 656 浏览

TokenSwift

TokenSwift是由北京通用人工智能研究院开发的超长文本生成加速框架，可在90分钟内生成10万Token文本，效率较传统模型提升3倍，且保持输出质量。其核心优势包括多Token并行生成、动态KV缓存管理、上下文惩罚机制等技术，支持多种模型架构。适用于内容创作、智能客服、学术研究及编程辅助等场景。

AI项目与工具 2025年06月12日 98 点赞 0 评论 648 浏览

MHA2MLA

MHA2MLA是一种由多所高校与研究机构联合开发的数据高效微调方法，基于多头潜在注意力机制（MLA）优化Transformer模型的推理效率。通过Partial-RoPE和低秩近似技术，显著减少KV缓存内存占用，同时保持模型性能稳定。仅需少量数据即可完成微调，适用于边缘设备、长文本处理及模型迁移等场景，具备高兼容性和低资源消耗优势。

AI项目与工具 2025年06月12日 47 点赞 0 评论 573 浏览

FoxBrain

FoxBrain是由鸿海研究院推出的大型语言模型，基于Meta Llama 3.1架构，拥有70B参数，专注于数学与逻辑推理领域。其采用高效训练策略，结合高质量中文数据与Adaptive Reasoning Reflection技术，提升推理能力。FoxBrain适用于智能制造、智慧教育、智能办公等多个场景，支持数据分析、代码生成、文书协作等功能，具备较强的上下文处理能力和稳定性。

AI项目与工具 2025年06月12日 97 点赞 0 评论 459 浏览

模型优化

首页

模型优化

列表

默认

浏览次数

发布日期