语音识别 - 智狐AI导航

Notta

Notta是由MIND CRUISER LIMITED推出的语音转写软件，主要针对个人使用，并在海外拥有数十万用户。这款软件具有录音实时转写、音/视频导入转写、文本多格式导出、音频标记等功能，...

Ai办公效率 2026年06月21日 0 点赞 0 评论 525 浏览

AI酱

AI酱是一款结合二次元元素与AI技术的多语言智能聊天工具，支持多种语言交流，具备语音识别和即时反馈功能。它通过生动的角色形象和标准化发音，帮助用户练习外语口语，并能在情绪疏导、旅行规划等方面提供个性化服务。此外，其多角色设定和场景切换功能进一步增强了用户体验。

AI项目与工具 2025年06月12日 37 点赞 0 评论 529 浏览

PengChengStarling

鹏城实验室开源的一款多语言语音识别系统开发工具包，PengChengStarling可以在统一的框架内处理多种语言语音输入，支持实时语音识别，边说边识别。

Ai语音工具 2025年06月05日 66 点赞 0 评论 530 浏览

通义浏览器插件

通义浏览器插件是一款集实时语音识别、AI字幕翻译、智能总结于一体的多功能AI工具。支持在线课程、会议记录、外语视频观看等多种应用场景，提供语音转文字、翻译、内容总结等功能，帮助用户高效管理在线信息。此外，用户可通过插件快速访问网页版平台，查看和整理记录内容，实现更便捷的信息处理体验。

AI项目与工具 2025年06月12日 84 点赞 0 评论 534 浏览

星辰大模型

星辰大模型是中国电信研发的AI工具集，涵盖语义、视觉、语音等多模态领域，支持长文本处理、多语种语音识别和多任务视觉处理。平台提供多种模型选择，包括星辰语义模型、星辰语音大模型及星辰多模态大模型，适用于智能客服、内容审核、智能写作、语音识别与合成、图像识别与分析等多种应用场景。

AI项目与工具 2025年06月12日 86 点赞 0 评论 536 浏览

小爱同学AI助手

由小米公司研发，基于小米的硬件生态和海量数据，为用户提供全球领先的语音识别、NLP等完整的 AI 技术服务。

AI写作对话 2025年06月05日 90 点赞 0 评论 540 浏览

PaddleSpeech

PaddleSpeech是百度飞桨团队开发的开源语音处理工具，涵盖语音识别、语音合成、声纹识别、语音翻译等功能。支持多种接口形式，适用于智能语音助手、语音播报、身份验证等场景。基于PaddlePaddle框架，提供高效的深度学习模型和丰富的音频处理能力，适用于多种实际应用需求。

AI项目与工具 2025年06月12日 87 点赞 0 评论 542 浏览

卡卡字幕助手 | VideoCaptioner

一款基于 LLM 的智能字幕助手，无需GPU一键高质量字幕视频合成！支持生成、断句、优化、翻译全流程。卡卡字幕助手让视频字幕制作简单高效！优化、翻译，字幕视频全流程一键处理！

Ai开源项目 2025年06月05日 64 点赞 0 评论 543 浏览

URO

URO-Bench 是一个面向端到端语音对话模型的综合评估工具，支持多语言、多轮对话及副语言信息处理。它包含基础和高级两个赛道，分别涵盖16个和20个数据集，覆盖开放性问答、情感生成、多语言任务等。支持多种评估指标，提供简单易用的评估流程，并兼容多种语音对话模型。适用于智能家居、个人助理、语言学习等多个实际应用场景。

AI项目与工具 2025年06月12日 47 点赞 0 评论 543 浏览

Nova Sonic

Nova Sonic是亚马逊推出的生成式AI语音模型，集成语音理解和生成功能，支持多种语言和口音，具备高准确性与自然对话能力。其采用HiFi语音识别技术，平均单词错误率低至4.2%，支持实时信息获取与请求路由，适用于客户服务、教育、医疗、旅游及娱乐等多个领域。该模型具备低延迟和高性价比优势，是当前市场上较为突出的语音处理工具。

AI项目与工具 2025年06月12日 61 点赞 0 评论 552 浏览

语音识别

首页

语音识别

列表

默认

浏览次数

发布日期