语言模型

smoltalk

Smoltalk-Chinese 是 OpenCSG 开发的中文大型语言模型专用合成数据集,包含 70 多万条高质量数据,涵盖多种任务类型,如信息查询、编程、数学、创意写作等。数据通过先进模型生成并经过严格筛选和去重,确保多样性与质量,适用于模型微调和多场景应用,提升语言理解和生成能力。

CHRONOS

CHRONOS是由上海交通大学与阿里巴巴集团联合开发的新闻时间线生成框架,基于大型语言模型(LLMs)实现开放域与封闭域的时间线构建。其核心机制包括迭代自问自答、问题重写与分而治之策略,能够高效处理信息过载与数据噪声,生成结构清晰、逻辑连贯的事件摘要。适用于新闻整理、金融分析、政府决策、教育研究及品牌宣传等多个领域。

AI.LS

一个基于gpt-3.5、gpt-4和Claude的优雅ChatGPT用户界面,作为ChatGPT的替代品。它提供了一个用户友好的界面,可以进行聊天机器人对话。

LongLLaVA

LongLLaVA是由香港中文大学(深圳)研究团队开发的多模态大型语言模型,结合Mamba和Transformer模块,利用2D池化技术压缩图像token,大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异,特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化,支持多种多模态输入处理,广泛应用于视频分析、医学影像诊断、环境监测等领域。

OpenBMB

OpenBMB作为一个大型的中英文双语基础模型,通过在大规模语料库上的预训练,具备了优秀的语言处理能力。

MiniMax开放平台

MiniMax开放平台是国内领先的拥有文本、语音、视觉三模态融合的千亿参数语言大模型。这个平台由创业公司MiniMax构建,致力于通过搭建超大规模实验平台与推理平台,实现技术与产品...

AgentReview

AgentReview是一款基于大型语言模型构建的学术同行评审模拟工具,通过模拟评审者、作者和领域主席的角色,研究评审偏见和决策机制对评审结果的影响。它支持隐私保护,无需真实敏感数据,同时验证了多种社会学理论在评审中的应用,为优化学术评审流程提供了重要参考。

OpenR

OpenR是一个由多家知名高校联合开发的开源框架,专注于通过强化学习和搜索技术提升大型语言模型的推理能力。它集成了数据获取、强化学习训练及非自回归解码功能,支持多种搜索算法和在线强化学习训练,能够有效提高模型的推理效率和精度。同时,其自动化数据处理能力减少了人工标注的需求,适用于数学问题求解、代码生成、自然语言处理等多种应用场景。

FineZip

FineZip 是一种基于大型语言模型的无损文本压缩工具,利用在线记忆和动态上下文大小技术优化压缩效率,显著提升压缩速度和压缩比。它适用于多种场景,包括数据存储、传输、数据库管理和大数据分析等,同时支持无损解压和高效批量处理。