音转文

Aqua Voice

Aqua Voice 是一款AI驱动的语音转录与文档编辑工具,支持语音转文字、自然语言指令编辑、自动格式优化及多语言处理。它适用于高效写作、辅助输入及跨平台办公场景,兼容多种主流应用,提升文本创作效率与准确性。

Wispr Flow

Wispr Flow 是一款基于AI技术的语音转文字工具,支持100多种语言,具备自动编辑、上下文感知和低音量识别等功能,提升写作与沟通效率。提供免费基础版及付费专业版和团队版,适用于写作、商务、学习等多种场景,注重用户隐私保护,操作便捷自然。

Dolphin

Dolphin是由清华大学与海天瑞声联合开发的面向东方语言的语音识别大模型,支持40种语言及22种中文方言,具备高精度语音转文字能力。采用CTC-Attention架构,结合E-Branchformer和Transformer技术,提升识别效率与准确性。模型开源,支持自定义语言与地区设置,适用于会议记录、语音输入、智能助手等多种场景。

MarkItDown

MarkItDown是一款由微软推出的开源文档转换工具,支持多种文件格式(如PDF、Office文档、图像、音频等)转换为Markdown格式。它具备OCR文字识别、语音转文字、元数据提取等功能,适用于文档归档、内容发布、数据挖掘、学术研究等多个场景,旨在简化文件处理流程,提升工作效率。通过提供简单易用的API接口,MarkItDown成为开发者友好型工具。

Oliva

Oliva 是一款基于语音驱动的 RAG 助手,结合 Langchain 和 Qdrant 向量数据库,实现语音指令到结构化数据的实时响应。支持多智能体协作、语义搜索与灵活知识库集成,适用于企业知识库、智能客服、智能家居等多种场景。具备语音识别、实时通信和自然语言处理能力,提升信息获取与交互效率。

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库,具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别,适用于语音助手、会议记录、实时字幕等场景,提供灵活的音频输入与预处理机制,便于开发者快速集成和扩展。

AsrTools

AsrTools是一款无需复杂配置的智能语音转文字工具,支持多种音频格式的转换,生成SRT和TXT字幕文件,适用于视频字幕、会议记录、音频转写等多个场景。它具有友好的用户界面、高效的多线程处理能力以及详细的技术文档,旨在为用户提供便捷、准确的语音转文字解决方案。

简单听记

百度网盘推出的一款AI语音转文字工具,简单听记能够帮你将音频内容转化为文字,还能进一步把这些文字提炼总结,帮你节省很多时间。

AI Transcribe

Transcribe 是一个基于 OpenAl 训练并开源的录音转文字工具,支持英语、中文等多种语言,最大的优点就是无需下载大型的模型文件。

Futuretools工具

FutureTools收集并组织了所有最好的AI工具,所以你也可以成为超人!