语音 - 智狐AI导航

Moonshine

Moonshine是一款专为资源受限设备设计的高效语音识别模型，支持实时语音转文本，具有低延迟、高准确率的特点。它基于编码器-解码器架构和旋转位置嵌入技术，适应不同长度的音频输入，计算需求随音频长度变化而调整，适合边缘设备部署。主要应用于会议转录、语音助手、听力辅助及多语言翻译等领域。

AI项目与工具 2025年06月12日 76 点赞 0 评论 691 浏览

Dubbingx

全球唯一、多情绪、多语态、全可控的AI配音产品

创作工具 2026年06月22日 0 点赞 0 评论 691 浏览

Fish Speech 1.5

Fish Speech 1.5是一款基于深度学习的文本转语音（TTS）工具，支持多语言文本输入，通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力，延迟时间短，无需依赖音素，泛化性强，且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

AI项目与工具 2025年06月12日 14 点赞 0 评论 692 浏览

Nuance

Nuance公司以其在对话式AI领域的专业知识，为医疗保健和客户参与提供创新解决方案。公司致力于通过AI技术推动组织效能，提升工作成效，并在全球范围内产生积极影响。

Ai语音工具 2026年06月22日 0 点赞 0 评论 693 浏览

Audio Enhancer

一个在线音频增强工具，Audio Enhancer使用人工智能算法来帮助用户轻松地减少音频文件中的背景噪音，用于改善音频录音的清晰度和整体质量。

Ai语音工具 2025年06月05日 16 点赞 0 评论 693 浏览

小虫快读BugQR

一款基于OCR技术和AI大语言模型的高效阅读工具。小虫快读通过拍照书籍页面，应用可以自动识别并总结书籍内容，帮助你快速获取书籍的核心信息，还能通过语音播放总结内容。

Ai办公效率 2025年06月05日 10 点赞 0 评论 693 浏览

度豆

度豆是一款由百度开发的AI社交应用程序，用户可以通过文字、语音或图片与AI数字人进行交流，享受个性化的聊天体验。每个AI数字人都具备独特的人格和背景故事，能够提供百科全书式的知识解答、生活建议以及情感支持。该应用适用于日常聊天、信息查询、学习辅导、语言练习、休闲娱乐和生活助手等多种场景。

AI项目与工具 2025年06月12日 37 点赞 0 评论 693 浏览

出门问问

出门问问，一家以生成式AI与语音交互为核心的人工智能公司。

AI服务商 2025年06月05日 24 点赞 0 评论 694 浏览

SlideSpeak

SlideSpeak是一款基于AI技术的多功能工具，支持用户上传多种文档格式并生成演示文稿或摘要。其主要功能包括AI生成的演示文稿、文档总结、交互式聊天机器人、视觉内容分析及语音旁白生成。此外，SlideSpeak强调数据安全性，适用于学术研究、商业演示、教育培训等多个领域。

AI项目与工具 2025年06月12日 11 点赞 0 评论 696 浏览

FunAudioLLM

FunAudioLLM是由阿里巴巴通义实验室开发的开源语音大模型项目，包含SenseVoice和CosyVoice两个子模型。SenseVoice擅长多语言语音识别和情感辨识，支持超过50种语言；CosyVoice则专注于自然语音生成，支持多种语言、音色和情感控制。该项目适用于多语言翻译、情感语音对话等场景，其相关模型和代码已公开发布。

AI项目与工具 2025年06月12日 66 点赞 0 评论 696 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期