TextHarmony TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型,擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术,支持视觉文本生成、编辑、理解及感知等功能,广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练,TextHarmony在视觉与语言生成任务中表现出色。 AI项目与工具 2025年06月12日 47 点赞 0 评论 341 浏览
UiNotes UI Notes ( uinotes.com ) 由 UI 设计师 mx 设计并开发,于 2021 年底上线并运营至今,目标是成为国内最完整最实用的 UI 设计灵感网站,为你节省寻找灵感的时间。 排版编辑 2025年06月05日 78 点赞 0 评论 342 浏览
Umi Umi-OCR 是一款离线 OCR 工具,支持图片、截图和 PDF 文档的文字识别,具备数学公式与二维码识别功能,可生成可搜索 PDF。支持多语言识别与界面切换,提供命令行和 HTTP 接口调用,适用于文档数字化、数据录入、教育等多个场景。 AI项目与工具 2025年06月12日 51 点赞 0 评论 353 浏览
小虫快读BugQR 一款基于OCR技术和AI大语言模型的高效阅读工具。小虫快读通过拍照书籍页面,应用可以自动识别并总结书籍内容,帮助你快速获取书籍的核心信息,还能通过语音播放总结内容。 Ai办公效率 2025年06月05日 10 点赞 0 评论 354 浏览
[官网]万兴PDF编辑器 万兴PDF编辑器是一款功能丰富的PDF处理软件,它通过提供直观的用户界面和强大的编辑工具,使用户能够轻松地完成PDF的创建、编辑、转换和保护等任务。 排版编辑 1970年01月01日 0 点赞 0 评论 358 浏览
Comic Translate Comic Translate 是一款基于开源框架的漫画翻译工具,支持多语言翻译,涵盖英语、韩语、日语、法语、简体中文、繁体中文、俄语、德语、荷兰语、西班牙语和意大利语等主流语言。它利用深度学习技术和图像处理库,实现从文本检测、OCR 到翻译渲染的全流程自动化,旨在帮助用户突破语言限制,享受跨文化阅读体验。同时,该工具支持自定义翻译服务,适合个人娱乐、教育学习、翻译本地化及学术研究等多个领域。 AI项目与工具 2025年06月12日 92 点赞 0 评论 368 浏览
Erase.Video 一个视频去水印、字幕、文字、不要的物体工具。用户只需上传视频文件,指定要去除的区域,然后很快下载处理好的视频。 视频剪辑 2025年06月05日 59 点赞 0 评论 369 浏览
Memento 一款基于mpv构建的开源视频播放器,专为学习日语设计。它巧妙地将视频播放与语言学习功能结合,支持通过影视内容进行语法分析、生词捕捉和记忆卡片制作。 Ai开源项目 2025年06月05日 80 点赞 0 评论 370 浏览