语音

Nuance

Nuance公司以其在对话式AI领域的专业知识,为医疗保健和客户参与提供创新解决方案。公司致力于通过AI技术推动组织效能,提升工作成效,并在全球范围内产生积极影响。

Vocloner

Vocloner是一款基于人工智能的在线语音克隆工具,用户可通过上传目标语音音频并输入文本,快速生成克隆声音,无需训练语音网络。支持多语言及多种中文方言,提供经典版本和更新版本两种克隆选项,经典版使用Coqui TTS技术,更新版采用Coqui AI的XTTS工具,增强克隆效果。功能包括即时语音克隆、模型创建与保存、多语言支持、不同说话风格和角色模仿,适用于内容创作、无障碍支持、语言学习和个性化数

Open Voice OS

一个社区驱动的开源语音 AI 平台,用于使用 NLP、可自定义的 UI 以及对隐私和安全的关注跨设备创建自定义语音控制界面。

MegaTTS 3

MegaTTS 3是由字节跳动与浙江大学合作开发的零样本文本到语音合成系统,采用轻量级扩散模型,支持中英文及混合语音合成,具备语音克隆、音色控制、韵律调节等功能。系统通过分解语音属性实现精准建模,可快速生成高质量语音,适用于教育、内容制作、语音交互等多个领域。

OpenVoice

OpenVoice是一款由MyShell开发的免费开源AI语音克隆工具,其主要功能包括精准的音色和音调克隆及灵活的语音风格控制。该工具能够捕捉并复制不同语言或口音的音色,生成自然流畅的语音,并支持零样本跨语言语音克隆。开发者可以通过GitHub项目地址进行本地安装和运行,也可以通过Lepton AI、MyShell或HuggingFace提供的在线演示体验该工具。

Loora

Loora是一款AI驱动的英语口语学习工具,通过模拟真实场景帮助用户提升英语表达能力。支持商务、面试、日常交流等多场景练习,提供实时发音、语法及流利度反馈。具备24小时可用性、个性化课程设计、语音识别与翻译功能,并支持学习进度跟踪,适用于各类英语学习者。

Fish Speech 1.5

Fish Speech 1.5是一款基于深度学习的文本转语音(TTS)工具,支持多语言文本输入,通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力,延迟时间短,无需依赖音素,泛化性强,且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

ChatTTS

ChatTTS是一个开源的专为对话场景设计的语音生成模型,特别适用于大语言模型(LLM)助手的对话任务,以及诸如对话式音频和视频介绍等应用。ChatTTS 不仅能说中文,英文也能 hold 住...

audiobot

audiobot是一款利用AI技术实现文本到语音转换的服务平台,支持多语言及多样化的声音选项。其主要功能包括文本转语音处理、多语言兼容性、即时音频生成及高质量MP3下载等。广泛应用于视频制作、有声读物创作、商业宣传及教育培训等领域,满足用户对专业音频内容的需求。

Buddy.ai

Buddy.ai是一款面向儿童的AI英语学习平台,结合语音识别与人工智能技术,提供个性化的游戏化学习体验。支持多种学习风格,包含语音互动、全身反应及多语言课程,适用于家庭、学校及特殊教育等场景,旨在提升孩子的语言能力与学习兴趣。