大型语言模型

Self

Self-Taught Evaluators是一种无需人工标注数据的模型评估框架，通过自我训练方式增强大型语言模型（LLM）的评估能力。其核心在于利用LLM生成对比输出并进行迭代优化，显著提升了模型评估的准确性，达到了与顶级奖励模型相媲美的效果，广泛适用于语言模型开发、内容评估、教育科研以及技术支持等领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 776 浏览

CursorCore

CursorCore 是一款基于大型语言模型的编程辅助工具，通过对话式交互支持代码补全、修改和错误修复。它整合代码历史、上下文信息及用户指令，利用自动化数据生成管道和基准测试优化模型性能，适用于日常编码、代码审查、教学学习及遗留代码维护等多个场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 778 浏览

ChatTS

ChatTS-14B 是一款由字节跳动开发的大型语言模型，专为时间序列数据的理解与推理设计，具备 140 亿参数规模。通过合成数据对齐技术提升任务表现，支持自然语言交互，可应用于金融、气象、工业、医疗和运维等多个场景，提供数据分析、预测与诊断功能。模型已开源，便于开发者使用和扩展。

AI项目与工具 2025年06月11日 73 点赞 0 评论 788 浏览

FinRobot

FinRobot是一款开源的AI代理平台，专注于金融领域的应用，基于大型语言模型（LLMs）构建能够执行复杂分析和决策的专业金融AI代理。平台通过金融思维链（CoT）提示功能提升分析能力，并通过开源方式促进AI在金融决策中的广泛应用。架构涵盖金融AI代理层、金融LLM算法层、LLMOps和DataOps层以及多源LLM基础模型层，支持市场预测、文档分析及交易策略等多种金融专业AI代理。

AI项目与工具 2025年06月12日 74 点赞 0 评论 791 浏览

AgileGen

AgileGen是一个基于人机协作的生成式软件开发框架，通过Gherkin语言定义用户需求并生成代码，支持快速原型设计和迭代优化。其主要功能包括需求收集与澄清、场景设计、代码生成及反馈迭代，同时具备记忆池机制以提升决策效率。适用于初创公司、教育领域及企业内部工具开发等场景。

AI项目与工具 2025年06月12日 94 点赞 0 评论 796 浏览

WebDesignAgent

WebDesignAgent是一款基于AI技术的自动化网页设计工具，支持文本到网站、图像到网站等多种输入方式，可生成功能齐全、设计精美的网页。它支持多页面设计、用户自定义及迭代优化，适用于个人博客、企业官网、电商页面等多种场景。通过集成自然语言处理、计算机视觉以及大型语言模型，WebDesignAgent能够智能化地完成从内容理解到网页生成的全过程。

AI项目与工具 2025年06月12日 85 点赞 0 评论 796 浏览

SAC

SAC-KG是一个基于大型语言模型（LLMs）的框架，用于自动化构建领域知识图谱。它包含生成器、验证器和剪枝器三大组件，能从原始语料库生成高精度的特定领域知识图谱，适用于医学、生物学等专业领域。SAC-KG支持大规模数据处理，其精度可达89.32%，显著优于现有方法。

AI项目与工具 2025年06月12日 65 点赞 0 评论 796 浏览

Goedel

Goedel-Prover是一款由多所高校联合开发的开源大型语言模型，专注于自动化数学问题的形式化证明生成。它通过将自然语言数学问题转化为形式语言（如Lean 4），生成准确且完整的证明过程。采用专家迭代方法持续优化模型性能，在多项基准测试中表现优异。该工具可应用于数学研究、教学、软件验证及AI算法验证等领域，具备强大的数学推理能力和广泛的应用前景。

AI项目与工具 2025年06月12日 50 点赞 0 评论 807 浏览

Agent Laboratory

Agent Laboratory是由AMD与约翰·霍普金斯大学合作开发的基于大型语言模型的研究辅助工具，支持从文献综述到报告撰写的全流程科研任务。它具备实验设计、代码生成、结果分析等功能，并通过多代理协作和用户反馈机制提升研究质量。实验表明其可显著降低研究成本，适用于机器学习、生物医学等多个领域。

AI项目与工具 2025年06月12日 68 点赞 0 评论 817 浏览

CodeArena

CodeArena是一个在线平台，用于实时比较多个大型语言模型（LLM）的代码生成能力。它通过实时渲染和排名机制，帮助开发者评估LLM的性能，包括代码的可读性、效率和准确性。CodeArena集成了开发者工具，支持企业选型、学术研究、编程教育和技能提升等多种应用场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 835 浏览

大型语言模型

首页

大型语言模型

列表

默认

浏览次数

发布日期