工具

OpenDeepResearcher

OpenDeepResearcher 是一款开源 AI 研究工具,通过迭代搜索和 LLM 驱动的推理,实现自动化信息查询、分析与报告生成。支持异步处理和去重功能,提升效率并减少重复工作。适用于金融、科研、政策等领域,为用户提供高效、低成本的研究解决方案。系统可自动完成从搜索到总结的全过程,广泛应用于文献综述、行业分析、公司研究等场景。

OCRmyPDF

OCRmyPDF 是一款开源的命令行工具,用于将扫描 PDF 转换为可搜索、可编辑的文档。基于 Tesseract OCR 引擎,支持 100 多种语言,具备图像优化、纠偏、清洁等功能,提升识别准确率。支持多核处理与批量操作,适合高效处理大量文件,且完全离线运行,保障数据安全。

node

Node-DeepResearch 是一款基于 Gemini 语言模型和 Jina Reader 的开源 AI 智能体,支持持续搜索、多步推理和复杂问题处理。用户可通过 Web Server API 实时获取查询进度,适用于文献综述、市场调研、新闻报道等多种场景。项目具备灵活性和可扩展性,适合研究人员和开发者使用。

AI编程工具L1

AI编程L1-L5分级体系定义了AI编程工具在自动化能力上的不同层次,从代码补全到全流程开发,覆盖从基础到高级的应用场景。L1至L5依次提升自动化程度,降低开发门槛,提高效率。各类工具支持代码生成、任务执行、项目构建及全流程部署,适合不同层级的开发者使用。L5则代表AI开发团队,模拟多代理协作完成复杂任务。

MnnLlmApp

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开发的开源 Android 应用,支持多种大语言模型在本地运行。具备多模态交互能力,可处理文本、图像、音频等多种输入输出任务。应用经过 CPU 推理优化,运行效率高,支持离线使用,保障数据安全。内置 Qwen、Gemma、Llama 等主流模型,适用于内容创作、智能助手、语言学习及创意设计等多种场景。

OpusClip

OpusClip 是一款基于人工智能的视频剪辑工具,能够将长视频自动转换为适合社交媒体传播的短视频。其核心功能包括自动剪辑、多平台发布、字幕生成与翻译、智能人脸追踪、关键词高亮等。用户可通过简单操作快速生成多个短视频版本,并支持品牌模板定制和团队协作。适用于社交媒体运营、营销推广、教育、新闻及音频内容转化等多种场景。

Gemini 2.0 Pro

Gemini 2.0 Pro是Google推出的高性能AI模型,具备200万tokens的上下文窗口,支持复杂任务处理、多语言理解和代码生成。它能调用外部工具如Google搜索和代码执行环境,提升信息获取与问题解决能力。适用于编程辅助、数据分析、学术研究、教育及创意内容生成等多个领域,是当前Google系列模型中的佼佼者。

Open Deep Research

Open Deep Research 是一个开源 AI 智能体,支持多语言模型和 Firecrawl 数据提取,用于执行复杂的研究任务。它提供统一 API 和 Next.js 框架,具备实时数据处理、结构化信息提取及多维度分析能力,适用于文献综述、行业分析、投资研究等场景。

Chatbox AI

Chatbox AI是一款开源跨平台AI助手,支持多语言模型集成与本地部署,提供图像生成、代码辅助、文档交互等功能。用户可自由定制并参与社区开发,确保数据安全与隐私保护,适用于办公、学习、开发等多种场景,提升工作效率与创意表达。

LOOK

LOOK是一款面向时尚设计师的AI设计工具,通过AIGC技术实现设计概念的实时可视化。支持草图转图像、批量生产、文生图、图生图及模特试穿等功能,提高设计效率与创意表达。集成多种工具,简化设计流程,适用于教育、创意开发、产品设计等多个场景。