语音识别 - 智狐AI导航

ChildMandarin

ChildMandarin是由智源研究院与南开大学合作开发的3-5岁儿童普通话语音数据集，包含41.25小时高质量语音，覆盖全国22个省市。数据通过家长引导式对话采集，保证自然真实。该数据集支持语音识别、说话人验证和语言研究，适用于儿童语言学习、教育系统、智能玩具和语音助手优化等领域，为儿童语音技术研究提供重要资源。

AI项目与工具 2025年06月12日 28 点赞 0 评论 590 浏览

听脑AI

听脑AI是一款AI智能语音助手，专注于语音转文本和实时录音总结，提供音视频转文字、实时录音转文本、AI总结、章节速览等功能。用户可以通过自由拖动文本查看音视频进度，享受便捷...

创作工具 2026年06月21日 0 点赞 0 评论 590 浏览

百聆

百聆是一款开源语音对话系统，融合语音识别、语音活动检测、大语言模型和语音合成技术，实现自然流畅的语音交互。支持低延迟运行，无需GPU，适用于边缘设备。具备记忆、工具调用和任务管理等功能，适用于智能家居、个人助理、车载系统等多种场景，提供高效的语音交互解决方案。

AI项目与工具 2025年06月12日 90 点赞 0 评论 590 浏览

Whispo

Whispo是一款AI驱动的语音转录工具，支持用户通过快捷键快速录制语音并将其转写为文本，同时具备本地数据处理、隐私保护及基于大型语言模型的文本后处理功能。它适用于会议记录、教育、自动字幕生成等多个场景，旨在提升工作效率和用户体验。

AI项目与工具 2025年06月12日 47 点赞 0 评论 591 浏览

S10.AI

S10.AI是一款基于人工智能的医疗辅助工具，主要功能包括实时生成精准的临床记录、EHR系统集成、自动化编码以及临床决策支持。它通过语音识别技术简化医生的工作流程，显著提升工作效率，同时保障数据安全与隐私合规。该工具适用于各类医疗机构、心理治疗机构及独立诊所，支持多语言转录并提供高度自定义选项。

AI项目与工具 2025年06月12日 82 点赞 0 评论 592 浏览

Mathtutor on Groq 是一款基于 Groq 架构的 AI 辅导工具，通过语音识别功能接收数学问题，结合强大的数学引擎提供实时解题过程与答案。其主要功能包括语音输入、LaTeX 公式渲染、高精度计算及自然语言处理支持，适用于代数、微积分等领域的学习与教学辅助。此外，它还集成了 xRx 框架、Whisper 和 Llama 模型，确保高效且精准的问题解决能力。Mathtutor on G

AI项目与工具 2025年06月12日 18 点赞 0 评论 595 浏览

Speechnotes

Speechnotes是一款基于AI的语音转文字工具，提供高精度语音识别、实时语音输入、语音命令支持、自动大写处理等功能，支持多平台操作（Chrome扩展、Android、iOS、API等）。它强调隐私保护，录音不经过人工处理且自动删除，适合快速转录、会议记录、写作、医疗记录等多种应用场景，是提升工作效率的理想选择。

AI项目与工具 2025年06月12日 68 点赞 0 评论 596 浏览

VideoSrt

VideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体（视频/音频）生成中/英文字幕、文本文件的业务场景。

Ai开源项目 2025年06月05日 31 点赞 0 评论 596 浏览

Lepton AI

Lepton AI是由贾扬清创办的云原生AI平台，提供了一系列工具和服务，降低AI应用开发的门槛，帮助开发者更容易地完成创建、部署和扩展任务。它提供了 Python SDK 和云计算平台。Pyth...

创作工具 2026年06月21日 0 点赞 0 评论 597 浏览

Eden AI

Eden AI 是一个简化产品，测试和集成不同的 AI 解决方案，而无需处理多个帐户、计费系统或技术复杂性的平台。

Ai学习资源 2025年06月05日 54 点赞 0 评论 597 浏览

语音识别

首页

语音识别

列表

默认

浏览次数

发布日期