语音识别

首页

语音识别

列表

默认

浏览次数

发布日期

S10.AI

S10.AI

S10.AI是一款基于人工智能的医疗辅助工具，主要功能包括实时生成精准的临床记录、EHR系统集成、自动化编码以及临床决策支持。它通过语音识别技术简化医生的工作流程，显著提升工作效率，同时保障数据安全与隐私合规。该工具适用于各类医疗机构、心理治疗机构及独立诊所，支持多语言转录并提供高度自定义选项。

AI项目与工具 2025年06月12日 82 点赞 0 评论 592 浏览

Whispo

Whispo

Whispo是一款AI驱动的语音转录工具，支持用户通过快捷键快速录制语音并将其转写为文本，同时具备本地数据处理、隐私保护及基于大型语言模型的文本后处理功能。它适用于会议记录、教育、自动字幕生成等多个场景，旨在提升工作效率和用户体验。

AI项目与工具 2025年06月12日 47 点赞 0 评论 591 浏览

ChildMandarin

ChildMandarin

ChildMandarin是由智源研究院与南开大学合作开发的3-5岁儿童普通话语音数据集，包含41.25小时高质量语音，覆盖全国22个省市。数据通过家长引导式对话采集，保证自然真实。该数据集支持语音识别、说话人验证和语言研究，适用于儿童语言学习、教育系统、智能玩具和语音助手优化等领域，为儿童语音技术研究提供重要资源。

AI项目与工具 2025年06月12日 28 点赞 0 评论 590 浏览

听脑AI

听脑AI

听脑AI是一款AI智能语音助手，专注于语音转文本和实时录音总结，提供音视频转文字、实时录音转文本、AI总结、章节速览等功能。用户可以通过自由拖动文本查看音视频进度，享受便捷...

创作工具 2026年06月21日 0 点赞 0 评论 590 浏览

百聆

百聆是一款开源语音对话系统，融合语音识别、语音活动检测、大语言模型和语音合成技术，实现自然流畅的语音交互。支持低延迟运行，无需GPU，适用于边缘设备。具备记忆、工具调用和任务管理等功能，适用于智能家居、个人助理、车载系统等多种场景，提供高效的语音交互解决方案。

AI项目与工具 2025年06月12日 90 点赞 0 评论 590 浏览

Tough Tongue AI 2.0

Tough Tongue AI 2.0

Tough Tongue AI 2.0 是一款多模态对话训练工具，适用于面试、职场沟通、销售谈判等多种场景。用户可自定义AI角色与语气，通过视频和音频反馈练习非语言沟通技巧，并获得个性化反馈以提升表达能力。支持多语言使用，可无限重试，便于反复练习。具备嵌入功能，方便集成到其他平台。

AI项目与工具 2025年06月12日 61 点赞 0 评论 583 浏览

数字鸭AI助手

数字鸭AI助手

数字鸭AI助手，一个同时具备ChatGPT4聊天 + Midjourney V5绘画双服务的小程序，上百个场景应用助你生活学习工作更方便。

Ai绘画生成 2025年06月05日 83 点赞 0 评论 567 浏览

Seamless Communication

Seamless Communication

强大的AI同声传译工具，它通过实时处理和翻译语音，极大地促进了跨语言沟通。其低延迟、高准确度和多语言支持的特点，使其成为国际会议、多语言工作环境和任何需要实时语音翻译的...

创作工具 2026年06月21日 0 点赞 0 评论 565 浏览

场辞

场辞,AI视频字幕制作软件，一款基于语音识别技术的视频字幕制作软件，一键智能识别字幕，提供语音转字幕、一键加字幕、视频加字幕，字幕快捷校对等功能，用AI加速你的创作。

Ai语音工具 2025年06月05日 87 点赞 0 评论 564 浏览

Multimodal Live API

Multimodal Live API

Multimodal Live API是谷歌推出的一种支持文本、音频和视频交互的AI接口，具备低延迟、实时双向通信和自然语言处理能力。它允许用户通过多种输入方式与AI互动，并支持会话记忆和外部功能调用，广泛应用于客户服务、在线教育、远程医疗、视频会议和娱乐等领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 563 浏览

微信公众账号

微信扫一扫加关注