模型 - 智狐AI导航

MT

MT-MegatronLM 是摩尔线程推出的开源混合并行训练框架，支持密集模型、多模态模型和 MoE 模型的高效训练。采用 FP8 混合精度、高性能算子库和集合通信库，提升 GPU 集群算力利用率。通过模型并行、数据并行和流水线并行技术，实现大规模语言模型的高效分布式训练，适用于科研、企业及定制化 AI 应用场景。

AI项目与工具 2025年06月12日 25 点赞 0 评论 720 浏览

APB是一种由清华大学等机构开发的分布式长上下文推理框架，通过稀疏注意力机制和序列并行推理提升大模型处理长文本的效率。采用更小的Anchor Block和Passing Block，结合查询感知的上下文压缩技术，减少计算开销并精准传递关键信息。在128K长度文本上，APB推理速度比Flash Attention快10倍，比Star Attention快1.6倍，适用于多种分布式环境和模型规模，广泛

AI项目与工具 2025年06月12日 64 点赞 0 评论 874 浏览

Botgroup.chat

Botgroup.chat 是一款支持多人 AI 交互的聊天平台，用户可自定义 AI 角色并进行群聊互动。平台兼容多种 AI 模型，支持实时对话、Markdown 排版及数学公式显示，具备上下文记忆和角色管理功能。项目基于 React 和 Cloudflare Pages 构建，部署便捷，代码开源，适用于语言学习、创意讨论等多种场景。

AI项目与工具 2025年06月12日 89 点赞 0 评论 555 浏览

赤兔Chitu

Chitu（赤兔）是清华大学与清程极智联合开发的高性能大模型推理引擎，支持多种GPU及国产芯片，打破对特定硬件的依赖。其具备全场景部署能力，支持低延迟、高吞吐、小显存优化，并在性能上优于部分国外框架。适用于金融风控、智能客服、医疗诊断、交通优化和科研等领域，提供高效、稳定的推理解决方案。

AI项目与工具 2025年06月12日 25 点赞 0 评论 622 浏览

MetaStone

MetaStone-L1-7B 是一款轻量级推理模型，具备强大的数学和代码推理能力，性能达到行业领先水平。基于 DeepSeek-R1-Distill-Qwen-7B 架构，采用 GRPO 训练方式，支持多种计算架构并具备高效的云原生部署能力。适用于数学解题、编程辅助、智能客服、内容创作等多个场景，具有广泛的应用价值。

AI项目与工具 2025年06月12日 43 点赞 0 评论 952 浏览