模型

MT

MT-MegatronLM 是摩尔线程推出的开源混合并行训练框架,支持密集模型、多模态模型和 MoE 模型的高效训练。采用 FP8 混合精度、高性能算子库和集合通信库,提升 GPU 集群算力利用率。通过模型并行、数据并行和流水线并行技术,实现大规模语言模型的高效分布式训练,适用于科研、企业及定制化 AI 应用场景。

APB

APB是一种由清华大学等机构开发的分布式长上下文推理框架,通过稀疏注意力机制和序列并行推理提升大模型处理长文本的效率。采用更小的Anchor Block和Passing Block,结合查询感知的上下文压缩技术,减少计算开销并精准传递关键信息。在128K长度文本上,APB推理速度比Flash Attention快10倍,比Star Attention快1.6倍,适用于多种分布式环境和模型规模,广泛

Botgroup.chat

Botgroup.chat 是一款支持多人 AI 交互的聊天平台,用户可自定义 AI 角色并进行群聊互动。平台兼容多种 AI 模型,支持实时对话、Markdown 排版及数学公式显示,具备上下文记忆和角色管理功能。项目基于 React 和 Cloudflare Pages 构建,部署便捷,代码开源,适用于语言学习、创意讨论等多种场景。

赤兔Chitu

Chitu(赤兔)是清华大学与清程极智联合开发的高性能大模型推理引擎,支持多种GPU及国产芯片,打破对特定硬件的依赖。其具备全场景部署能力,支持低延迟、高吞吐、小显存优化,并在性能上优于部分国外框架。适用于金融风控、智能客服、医疗诊断、交通优化和科研等领域,提供高效、稳定的推理解决方案。

MetaStone

MetaStone-L1-7B 是一款轻量级推理模型,具备强大的数学和代码推理能力,性能达到行业领先水平。基于 DeepSeek-R1-Distill-Qwen-7B 架构,采用 GRPO 训练方式,支持多种计算架构并具备高效的云原生部署能力。适用于数学解题、编程辅助、智能客服、内容创作等多个场景,具有广泛的应用价值。

文心大模型4.5

文心大模型4.5是百度推出的原生多模态大模型,具备强大的多模态理解、逻辑推理和文本生成能力。支持文字、图片、音频、视频等多种信息的综合处理,适用于教育、内容创作、智能客服及金融等领域。模型已上线百度智能云平台,企业与开发者可通过API调用,满足多样化业务需求。

文心大模型X1

文心大模型X1是百度开发的深度思考型AI模型,具备中文知识问答、逻辑推理、文学创作等能力,支持多模态内容生成与工具调用。采用递进式强化学习与端到端训练技术,结合飞桨平台实现高效推理。适用于文学创作、文案生成、学术研究、代码开发等多个领域,提供高性价比的AI服务。

Command A

Command A 是 Cohere 推出的企业级生成式 AI 模型,具备高性能和低硬件需求,支持 256k 上下文长度及 23 种语言。集成 RAG 技术,提升信息准确性。适用于文档分析、多语言处理、智能客服和数据分析等场景,适合企业部署使用。

AudioX

AudioX 是一种基于多模态输入的音频生成模型,支持文本、视频、图像等多种输入方式,能够生成高质量的音频和音乐。其核心创新在于多模态掩码训练策略,提升了跨模态理解和生成能力。具备零样本生成、自然语言控制及强大的泛化能力,适用于视频配乐、动画音效、音乐创作等多个场景。

万智

万智是零一万物推出的企业级AI解决方案,支持快速部署大模型,兼容多种硬件和架构,具备本地化部署能力,保障数据安全。平台集成RAG、联网搜索等功能,提升企业决策效率,并提供模型微调工具以满足垂直领域需求。采用Rewrite和Rerank技术优化输出准确性,显著提升性能。