音转文 - 智狐AI导航

AI Transcribe

Transcribe 是一个基于 OpenAl 训练并开源的录音转文字工具，支持英语、中文等多种语言，最大的优点就是无需下载大型的模型文件。

Ai语音工具 2025年06月05日 76 点赞 0 评论 810 浏览

OSUM

OSUM是一款由西北工业大学研发的开源语音理解模型，结合Whisper编码器与Qwen2 LLM，支持语音识别、情感分析、说话者性别分类等多种任务。采用“ASR+X”多任务训练策略，提升模型泛化能力和稳定性。基于约5万小时语音数据训练，性能优异，适用于智能客服、教育、心理健康监测等多个领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 812 浏览

悦录

悦录依托同花顺的语音识别技术，为用户提供免费的录音转文字、语音转文字、视频字幕等服务，1小时音频最快5分钟出稿，准确率高达97%+，全程加密，文件信息安全。

创作工具 2026年06月21日 0 点赞 0 评论 816 浏览

AsrTools

AsrTools是一款无需复杂配置的智能语音转文字工具，支持多种音频格式的转换，生成SRT和TXT字幕文件，适用于视频字幕、会议记录、音频转写等多个场景。它具有友好的用户界面、高效的多线程处理能力以及详细的技术文档，旨在为用户提供便捷、准确的语音转文字解决方案。

AI项目与工具 2025年06月12日 40 点赞 0 评论 826 浏览

Fineshare FineVoice

Fineshare FineVoice 是一款多功能 AI 配音生成工具，支持文本转语音、语音转文本、AI 变声、声音克隆和音频生成等功能。提供超过 1500 种声音和 149 种语言选项，适用于视频制作、播客、教育、营销等多种场景，助力用户高效创作高质量的多语言内容。具备强大的自定义能力和便捷操作，适合个人与企业用户使用。

AI项目与工具 2025年06月12日 87 点赞 0 评论 835 浏览

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库，具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别，适用于语音助手、会议记录、实时字幕等场景，提供灵活的音频输入与预处理机制，便于开发者快速集成和扩展。

AI项目与工具 2025年06月12日 97 点赞 0 评论 854 浏览

Oliva

Oliva 是一款基于语音驱动的 RAG 助手，结合 Langchain 和 Qdrant 向量数据库，实现语音指令到结构化数据的实时响应。支持多智能体协作、语义搜索与灵活知识库集成，适用于企业知识库、智能客服、智能家居等多种场景。具备语音识别、实时通信和自然语言处理能力，提升信息获取与交互效率。

AI项目与工具 2025年06月12日 57 点赞 0 评论 861 浏览

Aqua Voice

Aqua Voice 是一款AI驱动的语音转录与文档编辑工具，支持语音转文字、自然语言指令编辑、自动格式优化及多语言处理。它适用于高效写作、辅助输入及跨平台办公场景，兼容多种主流应用，提升文本创作效率与准确性。

AI项目与工具 2025年06月11日 81 点赞 0 评论 863 浏览

MarkItDown

MarkItDown是一款由微软推出的开源文档转换工具，支持多种文件格式（如PDF、Office文档、图像、音频等）转换为Markdown格式。它具备OCR文字识别、语音转文字、元数据提取等功能，适用于文档归档、内容发布、数据挖掘、学术研究等多个场景，旨在简化文件处理流程，提升工作效率。通过提供简单易用的API接口，MarkItDown成为开发者友好型工具。

AI项目与工具 2025年06月12日 22 点赞 0 评论 867 浏览

Wispr Flow

Wispr Flow 是一款基于AI技术的语音转文字工具，支持100多种语言，具备自动编辑、上下文感知和低音量识别等功能，提升写作与沟通效率。提供免费基础版及付费专业版和团队版，适用于写作、商务、学习等多种场景，注重用户隐私保护，操作便捷自然。

AI项目与工具 2025年06月12日 79 点赞 0 评论 869 浏览

音转文

首页

音转文

列表

默认

浏览次数

发布日期