开发者工具
AssemblyAI
一个提供将音频文件、视频文件和实时语音转录为文字的平台,提供了一个简单的API,允许用户访问用于转录和语音理解的即可用的AI模型。
Faster Whisper
Faster Whisper 是一款基于 OpenAI Whisper 模型的高效语音识别工具,利用 CTranslate2 引擎显著提升转写速度并降低内存消耗。它支持多语言处理,可应用于实时语音转写、视频字幕生成、客户服务、医疗记录等领域。其核心技术包括 8 位量化、语音活动检测(VAD)及模型优化,同时提供灵活的 API 接口供开发者集成。
飞桨PaddlePaddle开发者社区
飞桨是百度基于多年深度学习技术研究和业务应用打造的产业级深度学习平台。它是中国首个自主研发、功能完备、开源开放的产业级深度学习平台,集成了深度学习核心训练和推理框架、...
