Whisper Input 是一款基于 Python 和 OpenAI Whisper 模型开发的开源语音输入工具。用户可通过简单的快捷键操作(如按下 Option 键开始录音,松开结束录音)实现语音的实时转录与翻译。该工具支持多语言输入,包括中文、英文、日文等,并可处理中英文混合语音。其核心功能包括实时语音转录、多语言支持、翻译能力、高效处理速度、自动标点生成以及本地运行模式。Whisper Input 可通过 SiliconFlow 提供的免费 API 接口使用,无需付费或绑定信用卡。此外,它采用 Python 的 pyaudio 库进行音频采集和处理,具备良好的数据隐私保护能力。项目已开源,用户可通过 GitHub 获取并部署在本地环境中。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部