数学推理

腾讯混元Turbo S

腾讯混元Turbo S是腾讯推出的高效AI模型,采用Hybrid-Mamba-Transformer架构,提升推理效率并降低计算成本。支持快速响应、多领域推理、内容创作及多模态生成,适用于对话、代码、逻辑推理等场景。兼具短思维链与长思维链能力,性能对标行业领先模型。

OpenAI o3

OpenAI o3是一款具备图像推理能力的AI模型,融合了神经符号学习与概率逻辑,支持多模态任务处理。它能够自主调用工具解决复杂问题,擅长编程、数学、科学等领域,同时在安全性方面进行了显著优化。o3在多基准测试中表现优异,提供透明的推理路径和高效的多任务处理能力。

Satori

Satori是一款由MIT和哈佛大学等机构联合开发的7B参数大语言模型,专注于提升推理能力。其采用COAT机制和两阶段训练框架,结合强化学习优化模型性能,具备自回归搜索、数学推理、跨领域任务处理以及自我纠错等核心能力。Satori在数学和逻辑推理任务中表现突出,广泛应用于科研、教育、智能客服等多个领域,代码、数据和模型均已开源。

TinyR1

TinyR1-Preview是由北京大学与360公司联合研发的32B参数推理模型,采用“分治-融合”策略,通过智能融合数学、编程、科学领域的子模型,实现高性能表现。其在数学领域(如AIME)表现优异,仅用5%参数量即可达到原版R1模型95%以上的性能。模型轻量且高效,适用于教育、科研、开发及企业等多种场景,具备良好的部署灵活性与实用性。

TPO

TPO(Test-Time Preference Optimization)是一种在推理阶段优化语言模型输出的框架,通过将奖励模型反馈转化为文本形式,实现对模型输出的动态调整。该方法无需更新模型参数,即可提升模型在多个基准测试中的性能,尤其在指令遵循、偏好对齐、安全性和数学推理等方面效果显著。TPO具备高效、轻量、可扩展的特点,适用于多种实际应用场景。

TeleAI

TeleAI-t1-preview是中国电信人工智能研究院开发的复杂推理大模型,具有强大的数学与逻辑推理能力。它在多项国际评测中表现优异,尤其在数学竞赛和古籍解析方面表现突出。模型融合了强化学习与思考范式,支持从文言文到现代汉语的数学题解析,并具备策略推理与单位换算等功能。该模型即将上线天翼AI开放平台,未来将在教育、科研等领域广泛应用。