模型

通义万相

通义万相,一个不断进化的人工智能艺术创作大模型,擅长将奇思妙想转化为图画。

Humanloop

Humanloop工具提供了一个SDK,使用户能够更快、更便宜、更有效地制作GPT-3。用户可以收集最终用户的反馈,试验不同的提示和模型,并通过按下一个按钮来微调他们的模型。该工具还可...

Aya Vision

Aya Vision 是 Cohere 推出的多模态、多语言视觉模型,支持 23 种语言,具备图像描述生成、视觉问答、文本翻译和多语言摘要生成等能力。采用模块化架构与合成标注技术,确保在资源有限条件下仍具高效表现。适用于教育、内容创作、辅助工具开发及多语言交流等多个场景,具有广泛的实用价值。

OpenAI o1模型

OpenAI的最新推理系列AI大模型“Strawberry”,包括“o1-preview”和成本较低的“o1 mini”版本。该模型通过强化学习训练,具备复杂的推理能力和多模态理解能力。它采用了“思维链”机制,增强推理透明度,具备自我纠错功能。在国际数学奥林匹克等基准测试中表现出色,展现出强大的性能。设计时考虑了安全性、可靠性和成本效率。 ---

Sweep AI

Sweep AI 是一款利用人工智能技术优化软件开发流程的工具,集成了大型语言模型与代码分析引擎,主要功能涵盖代码搜索、重构、测试生成以及文档创建等。它旨在帮助开发者提高工作效率,简化代码管理,并支持灵活定制化设置以满足不同团队的需求。

Mistral Saba

Mistral Saba 是一款面向中东和南亚地区的定制化 AI 模型,具备 240 亿参数,专注于阿拉伯语及南亚语言(如泰米尔语、马拉雅拉姆语)的处理。其优势在于高效部署、低资源占用和高准确性,适合需要文化背景理解的场景。可通过微调应用于多个行业,并支持 API 和本地部署,适用于对话支持、专业领域知识生成及文化内容创作。

oli

oli 是一款开源的智能代码助手,结合 Rust 后端与 React/Ink 前端,提供高效的代码辅助、文件操作、命令执行等功能。支持多模型集成,包括云 API 和本地 LLM,适用于代码理解、优化、开发调试及项目管理等场景,提升开发效率和用户体验。

DrivingDojo

DrivingDojo是一个由中国科学院自动化研究所与美团无人车团队合作研发的数据集,包含18,000个视频片段,涵盖全面的驾驶操作、多智能体交互及开放世界驾驶知识。它定义了动作指令跟随(AIF)基准,用于评估世界模型的预测能力,并支持自动驾驶算法开发、世界模型训练、多智能体交互模拟及罕见事件处理等多个应用场景。

CoA

CoA是由谷歌开发的多智能体协作框架,用于解决大语言模型在处理长文本任务时的上下文限制问题。它将长文本分割成多个片段,由多个智能体依次处理并通过链式通信传递关键信息,最终由管理智能体整合生成结果。该框架无需额外训练,支持多种任务类型,如问答、摘要和代码补全,且具有高效性和可扩展性。其时间复杂度优化显著提升了处理长文本的效率。

MinT

MinT是一款基于时间基位置编码技术的多事件视频生成框架,允许用户通过文本提示生成包含多个事件的连贯视频,并支持对事件顺序及持续时间的精确控制。其核心技术ReRoPE使得模型能够有效关联文本提示与视频帧,同时结合预训练的视频扩散变换器(DiT)和大型语言模型(LLM)的提示增强功能,进一步提升了视频生成的质量与丰富度。MinT适用于娱乐、广告、教育等多个领域,为视频创作带来了创新性的解决方案。