文字

拍试卷

拍试卷是一款基于OCR技术的试卷扫描与处理软件,具备高清扫描、手写内容擦除、试卷还原等功能,支持将试卷内容转换为可编辑的文本格式、Word文档或PDF文件,适用于教师备课、学生自学、学术研究及出版行业等多个场景,同时提供图片文字识别、公式识别和PDF扫描识别等特色功能,全面提升工作效率。

啤啤熊

一款简单易用的AI绘画工具,用户只需输入一段文字,选择相应的主题和风格,啤啤熊即可免费生成精美的图片。

Whisper语音识别模型

Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。

WhisperKeyboard

WhisperKeyboard 是一款基于 OpenAI Whisper 技术的 AI 语音输入工具,支持多语言实时语音转文字,适用于写作、编程、会议记录等场景。具备离线识别、文本润色、多语言翻译和隐私保护等功能,兼容多平台,提升输入效率与文本质量。

FireRedASR

FireRedASR是小红书推出的工业级自动语音识别(ASR)模型系列,支持普通话、中文方言和英语,具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本,分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色,且已开源,推动语音识别技术的发展。

CopyFish

一个免费的 OCR 程序,可从图片、视频和 PDF 文件中提取文本。

音鹿

音鹿是一款基于AI技术的音频编辑工具,主要功能包括文字转语音、音色选择、AI翻唱及音频编辑(剪切、合并、混音、音量调节、变速变调)。该工具内置大量音色模型,支持实时预览与参数调整,广泛适用于社交媒体、广告宣传、教育培训等领域,帮助用户高效完成音频创作。

木言AI

专注于文字语音合成配音、字幕配音、智能视频创作的全自动化在线工具。制作视频无需出镜,木言AI是新自媒体人必不可少的工具!