大型语言模型

Co

Co-op Translator是一款基于Azure AI服务的开源多语言翻译工具,支持Markdown文件及图像文本的自动化翻译。它采用先进的大型语言模型(LLM)技术,确保翻译质量的同时保持语义准确性和上下文连贯性。该工具可无缝集成到现有项目中,帮助简化本地化流程,适用于开源项目文档、软件开发、技术博客、教育材料以及企业内部文档等多种应用场景。

CodeArena

CodeArena是一个在线平台,用于实时比较多个大型语言模型(LLM)的代码生成能力。它通过实时渲染和排名机制,帮助开发者评估LLM的性能,包括代码的可读性、效率和准确性。CodeArena集成了开发者工具,支持企业选型、学术研究、编程教育和技能提升等多种应用场景。

XGrammar

XGrammar 是一款由陈天奇团队开发的开源工具,旨在为大型语言模型提供高效的结构化数据生成能力。它基于上下文无关语法(CFG),支持生成 JSON 和 SQL 等格式的复杂数据结构,具备字节级下推自动机优化、自适应 token 掩码缓存以及上下文扩展等功能,能够显著提升生成效率并减少延迟,适用于编程语言辅助、数据库操作、自然语言处理、Web 开发等多个领域。

ChatTS

ChatTS-14B 是一款由字节跳动开发的大型语言模型,专为时间序列数据的理解与推理设计,具备 140 亿参数规模。通过合成数据对齐技术提升任务表现,支持自然语言交互,可应用于金融、气象、工业、医疗和运维等多个场景,提供数据分析、预测与诊断功能。模型已开源,便于开发者使用和扩展。

Perplexica

Perplexica是一款开源的AI驱动搜索引擎,支持多模式搜索(如全网、学术、视频等),兼容本地大型语言模型,具备强大的自然语言理解和实时信息更新能力。适用于个人、学术、企业和教育场景,帮助用户高效获取所需信息。

Self

Self-Taught Evaluators是一种无需人工标注数据的模型评估框架,通过自我训练方式增强大型语言模型(LLM)的评估能力。其核心在于利用LLM生成对比输出并进行迭代优化,显著提升了模型评估的准确性,达到了与顶级奖励模型相媲美的效果,广泛适用于语言模型开发、内容评估、教育科研以及技术支持等领域。

GTA

GTA是一项由上海交通大学与上海AI实验室合作研发的基准测试,专注于评估大型语言模型在真实世界环境中的工具调用能力。它包含229个精心设计的问题,涉及多个领域,并通过多模态输入输出和细粒度评估指标,全面衡量模型的工具使用效率与准确性。GTA可应用于智能助理开发、多模态交互、自动化客户服务、教育及科研等多个领域,助力提升人工智能系统的综合性能。

WebDesignAgent

WebDesignAgent是一款基于AI技术的自动化网页设计工具,支持文本到网站、图像到网站等多种输入方式,可生成功能齐全、设计精美的网页。它支持多页面设计、用户自定义及迭代优化,适用于个人博客、企业官网、电商页面等多种场景。通过集成自然语言处理、计算机视觉以及大型语言模型,WebDesignAgent能够智能化地完成从内容理解到网页生成的全过程。

Mistral Large

Mistral Large是Mistral AI开发的一款先进的大型语言模型,具备出色的多语言推理能力和强大的上下文理解能力。它在多个基准测试中表现出色,尤其是在多语言处理、推理和知识、数学与编程方面。Mistral Large支持多语言处理,并且能精确遵循指令,还支持函数调用,便于与开发者工具集集成。此外,该模型可通过Azure AI Studio和Azure Machine Learning平

DeepCoder

DeepCoder-14B-Preview 是一款基于 Deepseek-R1-Distilled-Qwen-14B 微调的开源代码生成模型,采用分布式强化学习技术,在 LiveCodeBench 基准上达到 60.6% 准确率。支持多语言代码生成、问题解决、补全优化、测试生成等功能,适用于开发、教育、竞赛等多个场景。项目提供完整训练数据与优化方案,推动 RL 在 LLM 中的应用。