OCR - 智狐AI导航

Comic Translate

Comic Translate 是一款基于开源框架的漫画翻译工具，支持多语言翻译，涵盖英语、韩语、日语、法语、简体中文、繁体中文、俄语、德语、荷兰语、西班牙语和意大利语等主流语言。它利用深度学习技术和图像处理库，实现从文本检测、OCR 到翻译渲染的全流程自动化，旨在帮助用户突破语言限制，享受跨文化阅读体验。同时，该工具支持自定义翻译服务，适合个人娱乐、教育学习、翻译本地化及学术研究等多个领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 721 浏览

Dpdf

好用的在线 PDF工具网站，提供免费的在线PDF工具，包括合并、拆分、转换PDF等功能。

Ai平台模型 2025年06月05日 95 点赞 0 评论 727 浏览

PaliGemma 2

PaliGemma 2是一款由Google DeepMind研发的视觉语言模型（VLM），结合了SigLIP-So400m视觉编码器与Gemma 2语言模型，支持多种分辨率的图像处理。该模型具备强大的知识迁移能力和出色的学术任务表现，在OCR、音乐乐谱识别以及医学图像报告生成等方面实现了技术突破。它能够处理多模态任务，包括图像字幕生成、视觉推理等，并支持量化和CPU推理以提高计算效率。

AI项目与工具 2025年06月12日 10 点赞 0 评论 730 浏览

CopyFish

一个免费的 OCR 程序，可从图片、视频和 PDF 文件中提取文本。

格式转换 2025年06月05日 81 点赞 0 评论 730 浏览

拍试卷

拍试卷是一款基于OCR技术的试卷扫描与处理软件，具备高清扫描、手写内容擦除、试卷还原等功能，支持将试卷内容转换为可编辑的文本格式、Word文档或PDF文件，适用于教师备课、学生自学、学术研究及出版行业等多个场景，同时提供图片文字识别、公式识别和PDF扫描识别等特色功能，全面提升工作效率。

AI项目与工具 2025年06月12日 29 点赞 0 评论 730 浏览

UPDF

UPDF是一款基于AI技术的多功能PDF工具，支持文本编辑、图片编辑、注释、转换、OCR识别、表单填写及签名等功能。其特色包括跨平台兼容性（Windows、Mac、Android、iOS及在线版本）、AI辅助阅读体验（总结、翻译、解释）以及便捷的商务与学术应用场景。适用于文档编辑、学术研究、商务沟通及法律文件处理等多样化需求。

AI项目与工具 2025年06月12日 83 点赞 0 评论 733 浏览

迅捷文字识别

在线一键提取图片中的文字

格式转换 2025年06月05日 63 点赞 0 评论 735 浏览

VideoDrafter

一个高质量视频生成的开放式扩散模型，相比之前的生成视频模型，VideoDrafter最大的特点是能在主体不变的基础上，一次性生成多个场景的视频。

Ai开源项目 2025年06月05日 89 点赞 0 评论 737 浏览

TextHarmony

TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型，擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术，支持视觉文本生成、编辑、理解及感知等功能，广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练，TextHarmony在视觉与语言生成任务中表现出色。

AI项目与工具 2025年06月12日 47 点赞 0 评论 739 浏览

EasyOCR

EasyOCR是一款基于深度学习技术的开源OCR工具，支持超过80种语言及多种书写系统。它提供高精度的文字识别能力，用户可通过简单的API轻松地将图像中的文本转换为可编辑的文本。EasyOCR易于安装和使用，支持跨平台操作，并具备批量处理能力。该工具在图像质量有一定要求的情况下，能够高效处理大量图像文件。

AI项目与工具 2025年06月12日 89 点赞 0 评论 739 浏览

OCR

首页

OCR

列表

默认

浏览次数

发布日期