推理

UltraMem

UltraMem是字节跳动推出的超稀疏模型架构,通过优化内存访问和计算效率,显著降低推理成本并提升速度。其核心技术包括多层结构改进、TDQKR和IVE,使模型在保持性能的同时具备更强的扩展性。适用于实时推理、大规模模型部署及多个行业场景。

Pixel Reasoner

Pixel Reasoner是由多所高校联合开发的视觉语言模型,通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作,如放大区域或选择帧,以捕捉细节。采用两阶段训练方法,结合指令调优和好奇心驱动的强化学习,提升视觉推理性能。在多个基准测试中表现优异,适用于视觉问答、视频理解等任务,广泛应用于科研、教育、工业质检和内容创作等领域。

MedReason

MedReason是由多所高校联合开发的医学推理框架,通过知识图谱增强大型语言模型在医学领域的推理能力。其核心功能包括生成高质量推理数据、提升模型性能、确保医学准确性,并支持多种医学任务。MedReason采用医学实体提取、路径搜索、链式推理生成和质量过滤等技术,有效提升模型在复杂临床场景中的表现。项目提供开源代码、模型和论文,适用于医学问答、辅助诊断、教育培训及研究等领域。

赤兔Chitu

Chitu(赤兔)是清华大学与清程极智联合开发的高性能大模型推理引擎,支持多种GPU及国产芯片,打破对特定硬件的依赖。其具备全场景部署能力,支持低延迟、高吞吐、小显存优化,并在性能上优于部分国外框架。适用于金融风控、智能客服、医疗诊断、交通优化和科研等领域,提供高效、稳定的推理解决方案。

百度灵医Bot

百度灵医Bot作为百度推出的医疗大模型应用,通过其强大的语言处理能力和专业医疗知识库,为用户提供了全面、安全、智能的医疗健康服务。

山海大模型

山海大模型是一款由云知声推出的多模态人工智能模型,具备强大的知识储备和多模态交互能力。它能够通过文本、音频和图像等形式与用户进行实时互动,提供信息查询、知识学习和灵感激发等服务。主要功能包括内容生成与理解、知识问答、逻辑推理、代码能力以及多模态交互特色,如实时响应、情绪感知、音色切换和视觉场景理解。该模型可应用于智能客服、教育辅助、医疗咨询、个人助理和内容创作等多个领域。

Gemma 3 QAT

Gemma 3 QAT 是谷歌推出的开源 AI 模型,采用量化感知训练技术,在降低显存需求的同时保持高性能。它支持多模态任务,具备 128,000-token 长上下文处理能力,并可在消费级 GPU 和边缘设备上运行。适用于视觉问答、文档分析、长文本生成等场景,同时兼容多种推理框架,便于部署。

VideoWorld

VideoWorld是由北京交通大学、中国科学技术大学与字节跳动合作开发的深度生成模型,能够通过未标注视频数据学习复杂知识,包括规则、推理和规划能力。其核心技术包括自回归视频生成、潜在动态模型(LDM)和逆动态模型(IDM),支持长期推理和跨环境泛化。该模型在围棋和机器人控制任务中表现优异,且具备向自动驾驶、智能监控等场景扩展的潜力。

书生InternThinker

书生InternThinker是一款由上海人工智能实验室开发的强推理模型,具备生成高智力密度数据及元动作思考的能力。它擅长处理数学、编程、逻辑推理等复杂任务,通过长思维能力和自我反思机制提升性能。模型采用通专融合技术和大规模沙盒环境反馈,实现复杂任务的高效解决,适用于教育、编程、科研、客服及法律等多个领域。

Fin

Fin-R1是由上海财经大学与财跃星辰联合开发的金融领域推理大模型,基于Qwen2.5-7B-Instruct架构,通过两阶段训练提升金融推理能力。其支持金融数据推理、代码生成、风险控制、ESG分析等多种功能,具备多语言支持与轻量化设计,适用于智能风控、投资辅助、量化交易等场景。模型在权威评测中表现优异,具有较高的实用价值。