R

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型,采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理,强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本,适用于研究、开发及各类应用场景,展现卓越性能。

卡内基梅隆大学

卡内基梅隆大学(Carnegie Mellon University),简称CMU,是坐落于美国宾夕法尼亚州的匹兹堡的私立大学,“新常春藤”,全球大学校长论坛成员。拥有14,800名在校学生和1,483名教职...

8spAi系统

8spAi系统集成了全模型AI问答、创作、绘画、文生图、思维导图一站搞定!GPT4对话识图、知识库训练、文档提问总结、DALLE-3绘图、Midjourney绘画动态全功能与思维导图自动生成等功能,为用户提供了智能化的服务和体验。

MakeAnything

MakeAnything是由新加坡国立大学Show Lab团队开发的多领域程序性序列生成框架,能够根据文本或图像生成高质量的分步教程。它采用扩散变换器和ReCraft模型,支持从文本到过程和从图像到过程的双向生成。覆盖21个领域,包含超24,000个标注序列,具备良好的逻辑连贯性和视觉一致性,适用于教育、艺术、工艺传承及内容创作等多种场景。

Promptstacks

一套针对大型语言模型(如ChatGPT)的免费、预先审查的提示。它还提供及时的工程支持,以帮助用户优化提示。此外,还有一个社区供用户讨论改进提示的技术。

RAGFlow

RAGFlow是一个开源的RAG(Retrieval-Augmented Generation)引擎,通过深度学习模型解析和理解文档内容,并增强生成能力。它提供了多种功能,包括自动化工作流、包管理、安全漏洞检测与修复、即时开发环境、AI辅助代码编写以及代码审查。RAGFlow的技术原理涵盖了文档理解、检索增强、生成模型、注意力机制、多模态处理、上下文融合和优化算法。该工具适用于内容创作辅助、数据摘

MAGI

MAGI-1是一款由Sand AI开发的开源视频生成大模型,采用自回归架构,支持高效、高质量的视频生成,具备高分辨率输出、无限扩展能力和可控生成特性。适用于内容创作、影视制作、游戏开发等多个领域,技术上融合了自回归去噪、Transformer VAE、扩散模型等创新方法,提升生成效率与稳定性。

AutoBE

AutoBE 是一款 AI 驱动的后端服务器代码生成工具,通过用户描述需求自动生成高质量的后端代码。基于 TypeScript、NestJS、Prisma 和 Postgres 等技术栈构建,强调“氛围编码”,结合瀑布模型和螺旋模型的优点,确保代码的可靠性和安全性。其主要功能包括需求分析、数据库模式生成、API 接口设计与代码生成、测试代码生成和代码实现,适用于快速开发新项目、提高开发效率、教学与

Bard PDF

一个用于汇总和分析 PDF 文档的终极 AI 驱动工具,AI Bard PDF允许用户通过自然对话上传PDF文档并与之交互。

馆长

馆长是一款基于RAG技术的浏览器插件式AI问答工具,支持本地知识库管理,可导入PDF、Word、网页等内容,通过语义搜索提供精准答案。所有数据存储于本地,保障隐私安全,支持离线使用。具备中英文搜索、无限文档导入、多平台集成等特性,适用于个人知识管理、企业内部知识库、在线学习及图书馆服务等场景。