大型语言模型

MLE

MLE-Agent是一款面向机器学习工程师和研究人员的智能助手，具备自动化基线创建、智能调试、文件系统集成、工具集成和交互式命令行界面等功能。它通过集成大型语言模型（LLM）、自动化机器学习（AutoML）、代码生成和检索（Code Generation and Retrieval）以及智能调试（Smart Debugging）等技术，提供无缝的AI工程和研究体验。MLE-Agent支持与多个AI

AI项目与工具 2025年06月12日 15 点赞 0 评论 1001 浏览

LightEval

LightEval是一款由Hugging Face开发的轻量级AI评估工具，旨在评估大型语言模型。它支持多设备运行，包括CPU、GPU和TPU，具备多任务处理能力和自定义评估功能。LightEval与Hugging Face的生态系统集成，便于模型管理和共享。适用于企业、科研人员及教育机构。

AI项目与工具 2025年06月12日 95 点赞 0 评论 881 浏览

braintrust

Braintrust 是一个端到端的 AI 工具平台，专注于通过迭代式的工作流帮助公司快速构建高效的 AI 应用。它提供了强大的提示调整、评分器配置及数据集管理功能，支持从模型评估到质量控制的全流程优化。此外，Braintrust 的直观界面和代码库集成特性使其适用于各类用户群体，广泛应用于 AI 产品开发、模型评估、质量控制及数据集构建等领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 840 浏览

SCoRe

SCoRe是一种由谷歌DeepMind提出的基于强化学习的多轮训练方法，旨在提高大型语言模型的自我纠错能力。它通过模型自动生成的数据进行训练，并采用正则化约束与奖励机制，有效提升了模型在数学、编程等任务中的准确性。此外，SCoRe能够适应训练与推理过程中的数据分布差异，展现出较强的灵活性与实用性。

AI项目与工具 2025年06月12日 42 点赞 0 评论 839 浏览

CodeArena

CodeArena是一个在线平台，用于实时比较多个大型语言模型（LLM）的代码生成能力。它通过实时渲染和排名机制，帮助开发者评估LLM的性能，包括代码的可读性、效率和准确性。CodeArena集成了开发者工具，支持企业选型、学术研究、编程教育和技能提升等多种应用场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 835 浏览

Agent Laboratory

Agent Laboratory是由AMD与约翰·霍普金斯大学合作开发的基于大型语言模型的研究辅助工具，支持从文献综述到报告撰写的全流程科研任务。它具备实验设计、代码生成、结果分析等功能，并通过多代理协作和用户反馈机制提升研究质量。实验表明其可显著降低研究成本，适用于机器学习、生物医学等多个领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 817 浏览

Goedel

Goedel-Prover是一款由多所高校联合开发的开源大型语言模型，专注于自动化数学问题的形式化证明生成。它通过将自然语言数学问题转化为形式语言（如Lean 4），生成准确且完整的证明过程。采用专家迭代方法持续优化模型性能，在多项基准测试中表现优异。该工具可应用于数学研究、教学、软件验证及AI算法验证等领域，具备强大的数学推理能力和广泛的应用前景。

AI项目与工具 2025年06月12日 50 点赞 0 评论 807 浏览

WebDesignAgent

WebDesignAgent是一款基于AI技术的自动化网页设计工具，支持文本到网站、图像到网站等多种输入方式，可生成功能齐全、设计精美的网页。它支持多页面设计、用户自定义及迭代优化，适用于个人博客、企业官网、电商页面等多种场景。通过集成自然语言处理、计算机视觉以及大型语言模型，WebDesignAgent能够智能化地完成从内容理解到网页生成的全过程。

AI项目与工具 2025年06月12日 85 点赞 0 评论 796 浏览

AgileGen

AgileGen是一个基于人机协作的生成式软件开发框架，通过Gherkin语言定义用户需求并生成代码，支持快速原型设计和迭代优化。其主要功能包括需求收集与澄清、场景设计、代码生成及反馈迭代，同时具备记忆池机制以提升决策效率。适用于初创公司、教育领域及企业内部工具开发等场景。

AI项目与工具 2025年06月12日 94 点赞 0 评论 795 浏览

SAC

SAC-KG是一个基于大型语言模型（LLMs）的框架，用于自动化构建领域知识图谱。它包含生成器、验证器和剪枝器三大组件，能从原始语料库生成高精度的特定领域知识图谱，适用于医学、生物学等专业领域。SAC-KG支持大规模数据处理，其精度可达89.32%，显著优于现有方法。

AI项目与工具 2025年06月12日 65 点赞 0 评论 795 浏览

大型语言模型

首页

大型语言模型

列表

默认

浏览次数

发布日期

MLE