文字

OLOCR

一个简单易用的在线 OCR 文字识别工具,支持图片、PDF。用户只需将图像和PDF文件上传到平台,即可提取文本。

Edimakor

Edimakor是一款基于AI技术的视频编辑工具,具备AI字幕翻译、智能脚本生成、文字转语音、AI视频生成等多种功能,大幅简化视频制作流程,提升工作效率。它适用于内容创作者、教育机构、企业宣传等多个领域,支持多语言字幕翻译与配音,助力全球化传播。

Exemplary AI

Exemplary AI是一款基于AI技术的内容处理工具,可将长视频和音频转换为短视频片段、文字记录及摘要等形式,同时支持多语言字幕生成和社交媒体优化。其主要功能包括视频剪辑、文本记录、AI写作、多语言支持等,广泛应用于社交媒体营销、教育培训、企业培训等领域,助力用户高效创作并传播优质内容。

edge

edge-tts 是一个开源的AI文字转语音项目,支持超过40种语言和300多种声音。该项目利用微软Azure Cognitive Services技术,能够将文本信息转换为流畅自然的语音输出。edge-tts 提供了丰富的语言和声音选择,易于集成且具有高度可定制性。其主要功能包括多语言支持、多样声音选择、流畅自然语音、易于集成的API以及开源特性。edge-tts 广泛应用于辅助技术、客户服务、

拍试卷

拍试卷是一款基于OCR技术的试卷扫描与处理软件,具备高清扫描、手写内容擦除、试卷还原等功能,支持将试卷内容转换为可编辑的文本格式、Word文档或PDF文件,适用于教师备课、学生自学、学术研究及出版行业等多个场景,同时提供图片文字识别、公式识别和PDF扫描识别等特色功能,全面提升工作效率。

Sunoify

Sunoify是一款利用人工智能技术实现文字、图片、表情符号甚至产品链接向音乐转化的在线平台。它提供多种创作模式,包括文字转音乐、图片音乐化等,并支持个性化风格定制。Sunoify适合视频制作者、品牌营销团队以及音乐爱好者,帮助他们快速生成高质量的原创音乐,满足不同场景需求。

话袋AI笔记

新一代AI卡片笔记产品,具备随时记录、多端同步、资源收藏、笔记串联等多种功能,话袋AI笔记是你生活、学习、工作中好帮手。

PearOCR

PearOCR,一个完全免费的在线OCR图像转文字网站。支持简体中文、繁体中文、英文、日文、韩文五种语言。

TokenFD

TokenFD是由上海交通大学与美团联合开发的细粒度图文对齐基础模型,专为文档理解任务设计。通过图像与语言Token的统一特征空间对齐,支持Token级图文交互,提升了多模态任务性能。其基于自研的TokenIT数据集进行训练,涵盖2000万张图像和18亿高质量Token-Mask对,覆盖多种文本图像类型。TokenFD可用于文档处理、图像审查、文字检索及大模型知识增强等多个领域,具有广泛的适用性和

68媒视频神器

一款集视频和音频转文字、短视频快速提取字幕、短视频去水印等功能的视频处理工具。