转录

WhisperChain

WhisperChain 是一款开源语音识别工具,支持实时语音转文本并提供文本优化功能,可去除填充词、优化语法。用户可通过全局热键快速启动语音输入,处理结果自动复制到剪贴板。支持 Streamlit 界面与 FastAPI 架构,适用于会议记录、写作辅助等场景。

Scribe

Scribe 是由 ElevenLabs 推出的高精度语音转文本模型,支持 99 种语言,具备多说话者区分、非语言事件检测和单词级时间戳功能。输出结构化的 JSON 数据,适用于会议记录、字幕生成、内容创作等多种场景,广泛应用于教育、客服及媒体领域。

VoicePen Ai

一款语音转博客AI工具,使用VoicePen可以在几分钟内将音频、视频、语音备忘录和网站转换为博客文章。

TurboScribe Ai

一项语音AI转文字服务,提供无限音频和视频转录。TurboScribe Ai可以将音频和视频文件转换为98+种语言的文本,准确率极高。

BrightHire

BrightHire是一款基于AI技术的招聘平台,提供结构化面试计划设计、自动记录与转录面试、AI驱动的面试笔记及即时反馈等功能。它可与多种现有系统无缝集成,并通过减少招聘偏见、加速决策速度来提升招聘质量和效率,同时优化候选人体验。

Visla

Visla的AI视频生成器为用户提供了一个强大的工具,可以轻松地将各种内容转换成视频,无需专业的视频编辑技能。

Riverside

Riverside 是一款 AI 转录工具,允许用户快速可靠地转录 100 多种语言的音频和视频文件。它具有易于使用的界面、出色的准确性、说话人识别功能,并支持多种文件类型。

Videotoword.ai

Videotoword.ai 是一款以AI驱动的在线服务,支持将音频和视频文件转化为文本,具有高精度(99.9%)和多语言支持(98种以上)。它能处理长达10小时的文件,具备自动转录、文本编辑导出及AI摘要生成功能,广泛应用于教育、媒体、法律和企业等领域。

Vocol.Ai语音转文本神器

Vocol.Ai语音转文本神器,一个一体化语音协作平台,它使用人工智能将语音高精度地转换为文本并分享可操作的见解。它具有多种语言转录功能。

Moonshine

Moonshine是一款专为资源受限设备设计的高效语音识别模型,支持实时语音转文本,具有低延迟、高准确率的特点。它基于编码器-解码器架构和旋转位置嵌入技术,适应不同长度的音频输入,计算需求随音频长度变化而调整,适合边缘设备部署。主要应用于会议转录、语音助手、听力辅助及多语言翻译等领域。