OCR

Tesseract

Tesseract是一款开源的光学字符识别(OCR)引擎,支持多语言识别和多种图像格式。其具备高精度的文字识别能力,适用于文档数字化、表格数据提取、发票识别及移动OCR应用等多个场景。支持跨平台运行,并提供丰富的编程接口和自定义训练功能,便于开发者集成和优化识别效果。

PDF24

一款提供全面的 PDF 解决方案的免费软件。用户可以通过 PDF24 在线和离线工具轻松合并、压缩、编辑和转换 PDF 文件。

Hipdf

Hipdf,​一站式在线PDF解决方案,PDF转Word在线免费转换工具,是一款完全免费的PDF在线编辑工具。

亿图脑图MindMaster

免费领会员_在线协作办公绘图工具,AI助手一键生成思维导图,AI绘画,AI对话,OCR文字提取

PDFtoPDF

PDFtoPDF是一款基于AI和OCR技术的PDF转换工具,支持高精度文字识别(准确率达99.5%),并能保留原始文档排版。具备多语言支持、文件压缩、跨平台使用及翻译功能,适用于学术、办公、教育和个人文档管理等多种场景,显著提升文档处理效率与便捷性。

掌上识别王

一款功能丰富的文字识别和图片转文字的工具类软件,掌上识别王能够实现高精度的文字识别,支持多种图片格式和文档。

OmniParser

OmniParser是一款由微软研究院开发的屏幕解析工具,能够将UI截图转换为结构化数据,通过识别可交互图标和提取功能语义,提升基于大型语言模型的UI代理系统的性能。它支持跨平台应用,无需依赖额外信息,适用于自动化软件测试、虚拟助手、辅助技术等多个领域。

Docling

Docling 是一款开源工具,支持多种文档格式的解析与转换,包括 PDF、DOCX、PPTX、图片和 HTML。它通过高级 PDF 理解和 OCR 技术,将文档内容转换为统一的结构化格式(如 Markdown 和 JSON)。Docling 可与 LlamaIndex 和 LangChain 集成,增强文档的检索和问答能力,并提供简洁的命令行界面,适用于自动化文档处理、数据科学、知识管理和信息检

智能翻译官

AI智能翻译引擎,涵盖文本、文档、图片、视频、音频等多种在线翻译模式,更有强大的文档格式转换处理功能,为您节约80%的时间。

Coral AI

Coral AI 是一款基于 AI 的文档分析平台,专注于智能搜索、摘要生成、翻译及问答功能。它支持超过 90 种语言,适用于学术研究、法律分析和商业报告等场景,特别适合处理大量文档。主要功能包括智能搜索、自动摘要生成、实时翻译、引用生成、跨文档搜索、文档标记与管理等,并支持多种文件类型和图像分析。