检索

深言科技

深言科技是一家由孙茂松教授和其学生一同创办的创业公司,致力于使用世界领先的人工智能和自然语言处理技术,为数亿脑力劳动深言科技(DeepLang AI)者和数千万组织的信息处理全流...

Docmatix

Docmatix 是一个专为文档视觉问答任务设计的大规模数据集,包含240万张图像和950万个问题-答案对,源自130万个PDF文档。数据集覆盖广泛,包括扫描图片、PDF文件和数字文档,且具有高质量的问答对。Docmatix 支持模型训练和微调,可用于训练视觉语言模型,提高其在理解和回答与文档内容相关问题方面的性能。应用场景包括自动化客户服务、智能文档分析、教育和学术研究以及业务流程自动化等。

千笔AI论文写作

AI原创论文写作平台,千笔AI论文具备选题、文献检索、写作助手等多项实用功能,提供真实网络数据、图、表、公式、代码,不限次2000字3级大纲,附带ppt、开题报告、任务书、40篇真实参考文献。

微信AI问书

一个集成了先进AI技术的阅读辅助工具,AI问书通过智能分析和解答用户的查询,以及提供深入的文献链接,极大地丰富了用户的阅读体验。

瀚海智语

瀚海智语(OceanDS)是国内首个面向海洋领域的垂直大语言模型,基于360智脑和Deepseek-R1大模型开发,具备海洋知识问答、信息检索、政策分析等功能。拥有全球最丰富的海洋中文知识库,词元总量超18亿,采用增量式数据库与加密技术保障信息安全。适用于海洋科研、教育、灾害预警及政策支持等领域,提供高效、专业的AI服务。

SurveyX

SurveyX 是一款基于大型语言模型的学术综述生成工具,由多所高校联合开发。它通过用户输入的标题和关键词,自动生成高质量、结构化的学术综述,适用于多个研究领域。系统具备高效的文献检索与整合能力,结合智能大纲生成和内容优化技术,提升综述的准确性和逻辑性。同时支持动态更新和多模态展示,广泛应用于科研、教学及行业分析场景。

Qwen3 Reranker

Qwen3 Reranker是阿里巴巴通义千问团队推出的文本重排序模型,属于Qwen3模型家族。它采用单塔交叉编码器架构,能够对文本对进行相关性评估并输出得分,支持超过100种语言。通过多阶段训练范式和高质量数据训练,模型在MTEB排行榜上表现优异。Qwen3 Reranker可用于语义检索、文本分类、情感分析和代码搜索等场景,提升信息检索效率和准确性。

ReasonIR

ReasonIR-8B 是由 Meta AI 开发的推理密集型检索模型,基于 LLaMA3.1-8B 训练,采用双编码器架构,提升复杂查询处理能力。结合合成数据生成工具,增强模型在长上下文和抽象问题中的表现。在多个基准测试中表现优异,适用于问答系统、教育、企业知识管理和科研等领域。

LongRAG

LongRAG是一个专为长文本问答设计的双视角鲁棒检索增强生成框架,包含混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM增强生成器。它通过整合全局上下文与细节信息,解决长文本中的复杂问答挑战,并在多个数据集上展现优异性能。此外,其自动化微调数据构建能力增强了模型的指令遵循能力和领域适用性。

PaSa

PaSa是由字节跳动研发的基于强化学习的学术论文检索系统,能够模仿人类研究者行为,自动调用搜索引擎、分析论文内容并追踪引文网络,提供精准全面的学术文献检索服务。其核心技术包括Crawler和Selector两个智能体,结合强化学习优化,显著提升了搜索效率与准确率。PaSa适用于学术研究、高校教学、知识产权分析等多个领域,具备高效检索和复杂查询处理能力。