ps
DeepSeek R1
DeepSeek R1-Zero 是一款基于纯强化学习训练的推理模型,无需监督微调即可实现高效推理。在 AIME 2024 竞赛中 Pass@1 分数达到 71.0%,展现强大逻辑与数学推理能力。支持长上下文处理,具备自我进化、多任务泛化等特性,并通过开源和蒸馏技术推动模型应用与优化。
OPPO小布助手网页版
网址是xiaobu.coloros.com ,融合满血版DeepSeek,支持同步手机端历史记录、联网搜索、结果导出为多种格式,具备AI深度思考模式。