语音识别 - 智狐AI导航

Multi

Multi-Speaker 是 AudioShake 推出的高分辨率多说话人分离工具，支持将音频中不同说话人的语音精准分离至独立轨道，适用于广播级音频处理。它具备高保真音频处理能力，支持高采样率，能处理长达数小时的录音，在复杂场景下仍能保持稳定效果。广泛应用于影视、播客、无障碍服务及内容创作等领域，提升音频编辑效率与质量。

AI项目与工具 2025年06月12日 55 点赞 0 评论 831 浏览

RTranslator

RTranslator是一款基于AI技术的开源、免费离线翻译应用，专为Android设备设计。它支持对话模式、对讲机模式及文本翻译功能，能够实现高质量的多语言实时翻译。RTranslator采用Meta的NLLB翻译模型和OpenAI的Whisper语音识别技术，支持多种语言，完全离线运行，保障用户隐私安全。

AI项目与工具 2025年06月12日 44 点赞 0 评论 839 浏览

绘影字幕

为视频自动添加字幕，自动识别视频中的人声，转化成字幕，字幕翻译，字幕制作软件

字幕配音 2025年06月05日 87 点赞 0 评论 842 浏览

星火陪练

星火陪练是一款基于AI技术的企业员工培训平台，集智能配置、自然对话、虚拟陪练及多维评分于一体。其主要功能包括快速生成课程内容、场景模拟对话、沉浸式虚拟陪练以及多维度评价反馈，广泛应用于企业培训、新员工入职、技能提升及在线教育等领域，助力员工高效掌握专业知识与实践技能。

AI项目与工具 2025年06月12日 61 点赞 0 评论 842 浏览

爱幕字幕编辑器

一款在线免费字幕编辑器，爱幕其核心优势在于提供了全面的字幕处理功能，支持视频转码、语音识别、字幕翻译和一键字幕压制等。

字幕配音 2025年06月05日 36 点赞 0 评论 844 浏览

Whisper Input

Whisper Input 是一款开源语音输入工具，基于 Python 和 OpenAI Whisper 模型开发，支持多语言语音识别与实时转录。用户可通过快捷键操作录音并生成文本，具备翻译、自动标点、高效处理及本地运行等功能。适用于会议记录、教育、智能交互及媒体制作等多种场景。

AI项目与工具 2025年06月12日 29 点赞 0 评论 846 浏览

PyVideoTrans

PyVideoTrans是一款开源的视频翻译配音工具，支持多语言处理，利用先进的语音识别和翻译技术，实现视频内容的自动翻译，并添加自然流畅的配音和同步字幕。该工具适用于影视后期、教育、企业宣传及自媒体创作等场景，帮助内容创作者跨越语言障碍，扩大受众群体。

AI项目与工具 2025年06月12日 100 点赞 0 评论 848 浏览

网易见外

网易见外是由网易人工智能事业部研发的AI智能语音转写听翻平台，提供视频听翻、直播听翻、语音转写、文档直翻等功能。

Ai语音工具 2026年06月21日 0 点赞 0 评论 849 浏览

Moshi

Moshi是一款由法国Kyutai实验室开发的端到端实时音频多模态AI模型，具备听、说、看的能力，并能模拟70种不同的情绪和风格进行交流。Moshi具有多模态交互、情绪和风格表达、实时响应低延迟、语音理解与生成、文本和音频混合预训练以及本地设备运行等特点。它支持英语和法语，主要应用于虚拟助手、客户服务、语言学习、内容创作、辅助残障人士、研究和开发、娱乐和游戏等领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 849 浏览

Arctime字幕软件

简单、强大、高效的跨平台字幕制作软件

字幕配音 2025年06月05日 76 点赞 0 评论 850 浏览

语音识别

首页

语音识别

列表

默认

浏览次数

发布日期