模型

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型,采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理,强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本,适用于研究、开发及各类应用场景,展现卓越性能。

百度AI助手

百度AI灵感中心,打开即用、提供大量 AI 应用场景的 AI 助手。

六合AI大模型

六合AI大模型,融合了众多主流语言模型,包括GPT3.5、GPT4.0、文心一言、讯飞星火、Midjourney、LLaMA等一站式AI智能平台。

Ming

Ming-Lite-Omni是蚂蚁集团开源的统一多模态大模型,基于MoE架构,支持文本、图像、音频和视频等多种模态的输入输出,具备强大的理解和生成能力。模型在多个任务中表现优异,如图像识别、视频理解、语音问答等,适用于OCR识别、知识问答、视频分析等多个领域。其高效处理能力和多模态交互特性,为用户提供一体化智能体验。

Vanna

Vanna 是一款开源的 Python RAG 框架,能够基于大型语言模型生成精确的 SQL 查询。它支持多类型数据库与 LLMs,采用检索增强生成技术提高查询准确性,同时保障数据安全。Vanna 还具备自定义前端界面和用户反馈机制,广泛适用于数据分析师、BI 工具、客户支持系统及数据科学项目等领域。

CodeElo

CodeElo 是一款基于 Elo 评级系统的编程能力评估工具,用于衡量大型语言模型在编程竞赛中的表现。它从 CodeForces 平台选取题目,按难度和算法分类,并通过直接提交代码进行测试,确保评估的准确性。该工具可比较模型与人类程序员的水平,适用于模型优化、教学辅助及开发应用,为 LLMs 编程能力研究提供可靠参考。

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具,基于超10万小时播客数据训练,支持零样本语音合成与说话人适配,可在0.33秒内生成1秒音频,适合实时与长内容合成。支持本地部署与API调用,应用于播客、有声书、视频配音、AI角色及新闻播报等领域,兼具高效性与灵活性。

Step R

Step R-mini是一款由阶跃星辰推出的推理模型,具备主动规划、尝试与反思能力,适用于数学、逻辑推理、代码开发及文学创作等多种场景。模型基于慢思考机制,支持深度推理与多步骤验证,表现优异。其技术特点包括强化学习、数据质量优化、测试时计算扩展及模型规模增长,实现文理兼修,广泛应用于教育、科研、企业办公等领域。

Keble.AI

一个融合AI与数据的平台,能生成亚马逊产品分析报告,还可借助最新Listing模型挖掘新产品机会并生成分析报告,与自训练的 Listing LLM 模型或最新ChatGPT模型聊天。

Dream Studio模型

DreamStudio 模型是一个多功能的AI艺术创作平台,它通过提供文本到图像的转换服务,使用户能够轻松创作艺术作品。