大型语言模型

CodeArena

CodeArena是一个在线平台，用于实时比较多个大型语言模型（LLM）的代码生成能力。它通过实时渲染和排名机制，帮助开发者评估LLM的性能，包括代码的可读性、效率和准确性。CodeArena集成了开发者工具，支持企业选型、学术研究、编程教育和技能提升等多种应用场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 924 浏览

SCoRe

SCoRe是一种由谷歌DeepMind提出的基于强化学习的多轮训练方法，旨在提高大型语言模型的自我纠错能力。它通过模型自动生成的数据进行训练，并采用正则化约束与奖励机制，有效提升了模型在数学、编程等任务中的准确性。此外，SCoRe能够适应训练与推理过程中的数据分布差异，展现出较强的灵活性与实用性。

AI项目与工具 2025年06月12日 42 点赞 0 评论 924 浏览

LightEval

LightEval是一款由Hugging Face开发的轻量级AI评估工具，旨在评估大型语言模型。它支持多设备运行，包括CPU、GPU和TPU，具备多任务处理能力和自定义评估功能。LightEval与Hugging Face的生态系统集成，便于模型管理和共享。适用于企业、科研人员及教育机构。

AI项目与工具 2025年06月12日 95 点赞 0 评论 1016 浏览

MLE-Agent是一款面向机器学习工程师和研究人员的智能助手，具备自动化基线创建、智能调试、文件系统集成、工具集成和交互式命令行界面等功能。它通过集成大型语言模型（LLM）、自动化机器学习（AutoML）、代码生成和检索（Code Generation and Retrieval）以及智能调试（Smart Debugging）等技术，提供无缝的AI工程和研究体验。MLE-Agent支持与多个AI

AI项目与工具 2025年06月12日 15 点赞 0 评论 1126 浏览

大型语言模型

首页

大型语言模型

列表

默认

浏览次数

发布日期

CodeArena

SCoRe

LightEval

MLE

大型语言模型 首页 大型语言模型

列表 默认 浏览次数 发布日期

CodeArena

SCoRe

LightEval

MLE

大型语言模型

首页

大型语言模型

列表

默认

浏览次数

发布日期