语音识别 - 智狐AI导航

BILIVE

BILIVE 是一款面向 B 站直播的 AI 工具，支持自动录制、弹幕渲染、语音识别、片段切片、封面生成及自动投稿。兼容低配置设备，无需 GPU，适合个人及小型团队使用，提升直播内容制作效率。

AI项目与工具 2025年06月11日 33 点赞 0 评论 1005 浏览

Microsoft Dragon Copilot

Microsoft Dragon Copilot 是一款专为医疗行业设计的AI语音助手，结合语音识别与环境感知技术，支持多语言语音输入、自动化任务处理、信息检索等功能。旨在提升临床文档效率、减轻医护人员负担，并优化医疗服务流程。适用于医生、护士、行政人员及其他医疗团队成员，提升工作效率与患者体验。

AI项目与工具 2025年06月12日 57 点赞 0 评论 962 浏览

MooER

MooER是一款基于国产全功能GPU训练的开源音频理解大模型，由摩尔线程推出。它能够进行中文和英文的语音识别，并具备中译英的语音翻译能力。MooER在Covost2中译英测试集中取得25.2的BLEU分数，接近工业级标准。其主要功能包括语音识别、语音翻译、高效率训练以及开源模型。该模型采用深度学习架构和端到端训练模式，具有强大的多语言处理能力和广泛的适用性。

AI项目与工具 2025年06月12日 41 点赞 0 评论 950 浏览

Lingo

Lingo是一款由西湖心辰开发的国内首个端到端语音大模型，具备实时交互、语音理解、多风格语音表达、情绪价值等功能。Lingo在人机对话的自然流畅度和情绪感知方面表现出色，适用于智能家居、客户服务、教育、医疗等多个领域。其核心技术包括端到端设计、深度学习算法和自然语言处理，旨在提供高质量的语音交互体验。

AI项目与工具 2025年06月12日 22 点赞 0 评论 943 浏览

VITA

VITA-Audio 是一款开源的端到端多模态语音大模型，具备低延迟、高推理效率和多模态交互能力。其核心创新包括轻量级 MCTP 模块和四阶段渐进式训练策略，使模型在语音识别、文本转语音和口语问答等任务中表现优异。支持实时对话、智能客服、教育辅助、医疗辅助及内容创作等多种应用场景，适用于各类语音交互系统。

AI项目与工具 2025年06月11日 19 点赞 0 评论 914 浏览

面试狗

AI面试辅助工具是一款面向求职者的智能应用，支持语音识别、智能回答建议、多模式回答及简历关联等功能，帮助用户提升面试与笔试表现。用户可上传简历、截图题目，AI将生成针对性建议。工具支持多种使用方式，记录完整面试对话，便于复盘总结。适用于线上面试、双机位面试、在线笔试等多种场景。

AI项目与工具 2025年06月12日 57 点赞 0 评论 913 浏览

Whisper

Whisper是一个开源的自动语音识别系统，经过68万小时的多语言和多任务监督数据训练

Ai语音工具 2026年06月21日 0 点赞 0 评论 908 浏览

星火语音同传大模型

星火语音同传大模型是科大讯飞推出的国内首个端到端语音同传AI系统，支持37种语言，具备高精度翻译、流式处理、语境理解和语音合成优化等功能。模型可在5秒内完成同传，准确度高，适用于国际会议、商务交流、教育等场景，支持译文长度调节和设备兼容，提升跨语言沟通效率。

AI项目与工具 2025年06月12日 53 点赞 0 评论 905 浏览

本文介绍了15款基于人工智能技术的视频翻译工具，这些工具能够实现精准的语音识别、自然语言处理和机器学习，从而将视频内容从一种语言翻译成另一种语言，为全球观众提供无缝的语言转换体验。这些工具涵盖了多语言支持、精准翻译与文化适配、字幕与音频同步、自动对口型和重新配音、智能视频去文字、翻译视频文字、视频翻译精校版、支持多种语言、字幕调整和声音克隆等多个功能和特点，极大地提升了视频内容的本地化质量和传播效

AI项目与工具 2025年06月12日 52 点赞 0 评论 895 浏览

易途AI面试官

易途AI面试官是一款基于AI技术的模拟面试工具，支持多种岗位和行业，提供真实面试场景、智能追问及多维度评估功能。它能帮助求职者提升面试技巧，同时为企业提高招聘效率和精准度，具备个性化练习与流程优化等特点。

AI项目与工具 2025年06月12日 29 点赞 0 评论 881 浏览

语音识别

首页

语音识别

列表

默认

浏览次数

发布日期