大型语言模型

HelloBench

HelloBench 是一款开源基准测试工具，专注于评估大型语言模型在长文本生成任务中的表现。它基于布鲁姆分类法设计了五个子任务，并采用 HelloEval 方法实现高效自动化评估。该工具支持多领域应用，包括模型开发、学术研究、产品测试等，同时揭示了现有模型在长文本生成中的局限性。

AI项目与工具 2025年06月12日 93 点赞 0 评论 742 浏览

LocAgent

LocAgent是一款由多所高校联合开发的代码定位工具，通过构建代码库的图结构并结合大语言模型进行多跳推理，帮助开发者快速找到需修改的代码片段。支持多种开发任务，如错误修复、功能添加和性能优化，具备高效的搜索与定位能力，适用于大规模代码维护场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 744 浏览

Mistral Large是Mistral AI开发的一款先进的大型语言模型，具备出色的多语言推理能力和强大的上下文理解能力。它在多个基准测试中表现出色，尤其是在多语言处理、推理和知识、数学与编程方面。Mistral Large支持多语言处理，并且能精确遵循指令，还支持函数调用，便于与开发者工具集集成。此外，该模型可通过Azure AI Studio和Azure Machine Learning平

AI项目与工具 2024年01月01日 86 点赞 0 评论 745 浏览

GTA

GTA是一项由上海交通大学与上海AI实验室合作研发的基准测试，专注于评估大型语言模型在真实世界环境中的工具调用能力。它包含229个精心设计的问题，涉及多个领域，并通过多模态输入输出和细粒度评估指标，全面衡量模型的工具使用效率与准确性。GTA可应用于智能助理开发、多模态交互、自动化客户服务、教育及科研等多个领域，助力提升人工智能系统的综合性能。

AI项目与工具 2025年06月12日 20 点赞 0 评论 748 浏览

Ultravox

Ultravox 是一种多模态大型语言模型（LLM），能够直接处理文本和语音输入，无需额外的语音识别步骤。其核心技术包括多模态投影器，用于将音频数据转换为高维空间表示，显著提升语音理解和处理效率。该模型支持实时语音对话、多语言扩展及领域特定知识的学习，适用于智能客服、虚拟助手、语言学习、实时翻译及教育等领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 755 浏览

Reflection AI

Reflection AI是一个零代码AI Agent开发平台，用户可以创建个性化的AI聊天机器人，模仿真人的沟通风格。该平台基于生成式AI技术，尤其是大型语言模型（LLMs），允许用户通过个人数据训练AI，使其能够以独特方式进行交流。主要功能包括个性化AI Agent创建、快速部署、学习和适应、自定义和微调以及多渠道集成。应用场景广泛，涵盖客户服务、个人助理、社交媒体管理、教育和医疗咨询等领域。

AI项目与工具 2025年06月12日 97 点赞 0 评论 760 浏览

SWEET

SWEET-RL是Meta开发的多轮强化学习框架，专为提升大型语言模型在协作推理任务中的表现而设计。通过引入训练时的额外信息优化“批评者”模型，实现精准的信用分配与策略优化。在ColBench基准测试中，其在后端编程和前端设计任务中表现出色，成功率提升6%。适用于文本校对、社交媒体审核、广告合规等多种场景，具备高度的通用性和适应性。

AI项目与工具 2025年06月12日 15 点赞 0 评论 761 浏览

Co

Co-op Translator是一款基于Azure AI服务的开源多语言翻译工具，支持Markdown文件及图像文本的自动化翻译。它采用先进的大型语言模型（LLM）技术，确保翻译质量的同时保持语义准确性和上下文连贯性。该工具可无缝集成到现有项目中，帮助简化本地化流程，适用于开源项目文档、软件开发、技术博客、教育材料以及企业内部文档等多种应用场景。

AI项目与工具 2025年06月12日 81 点赞 0 评论 765 浏览

XGrammar

XGrammar 是一款由陈天奇团队开发的开源工具，旨在为大型语言模型提供高效的结构化数据生成能力。它基于上下文无关语法（CFG），支持生成 JSON 和 SQL 等格式的复杂数据结构，具备字节级下推自动机优化、自适应 token 掩码缓存以及上下文扩展等功能，能够显著提升生成效率并减少延迟，适用于编程语言辅助、数据库操作、自然语言处理、Web 开发等多个领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 765 浏览

Ditto

Ditto是一款基于Flask框架的Web应用程序生成工具，通过自然语言输入和大型语言模型（LLM）实现自动化代码生成，支持模块化结构和无代码操作，适合快速原型开发、教育学习及非技术人员使用。其核心功能包括自然语言解析、代码自动生成、模块化管理以及环境变量配置等。

AI项目与工具 2025年06月12日 99 点赞 0 评论 772 浏览

大型语言模型

首页

大型语言模型

列表

默认

浏览次数

发布日期