Jina-embeddings-v3 是一款由 Jina AI 开发的先进文本嵌入模型,专为多语言数据处理和长文本上下文检索而设计。该模型具备 5.7 亿参数,能够处理长达 8192 个 token 的文本,结合低秩适应(LoRA)适配器和 Matryoshka 表示学习技术,生成高质量的嵌入向量,适用于查询-文档检索、聚类、分类和文本匹配等任务。在 MTEB 基准测试中,其性能表现超越现有的专有嵌入模型,并保持较高的成本效益,适用于生产环境及边缘计算场景。
Jina-embeddings-v3 是一款由 Jina AI 开发的先进文本嵌入模型,专为多语言数据处理和长文本上下文检索而设计。该模型具备 5.7 亿参数,能够处理长达 8192 个 token 的文本,结合低秩适应(LoRA)适配器和 Matryoshka 表示学习技术,生成高质量的嵌入向量,适用于查询-文档检索、聚类、分类和文本匹配等任务。在 MTEB 基准测试中,其性能表现超越现有的专有嵌入模型,并保持较高的成本效益,适用于生产环境及边缘计算场景。
发表评论 取消回复