语音

Spirit LM

Spirit LM 是一种由 Meta AI 开发的多模态语言模型,能够处理文本和语音数据,支持跨模态学习。其基础版(BASE)和表达版(EXPRESSIVE)分别侧重于语义理解和情感表达。Spirit LM 可用于自动语音识别(ASR)、文本到语音(TTS)、语音分类及情感分析等任务,在语音助手、语音转写、有声读物等领域具有广泛应用前景。

Outspeed

Outspeed 是一个专注于实时语音和视频 AI 应用开发的平台,提供强大的流媒体处理、低延迟推理、即时部署等功能,支持企业级合规标准。其核心特性包括灵活的模型定制、全面的 SDK 支持以及高效的应用监控工具,广泛应用于客户服务、教育、医疗保健、娱乐、安全监控和质量控制等领域。

Narakeet

Narakeet 是一款基于自然语音合成技术的在线工具,支持将文本、文档和字幕转换为高质量音频并同步至视频。提供 100 多种语言和 800 多种声音,支持自动化视频制作和多平台分发,适用于教育培训、市场营销、企业沟通及个人创作等多种用途。

Quick Mock

Quick Mock 是一款由 MirWork AI 开发的 AI 驱动型面试准备工具,能够将职位描述转化为定制化模拟面试体验。用户可通过 Chrome 扩展程序与 AI 面试官进行实时语音对话,并获得详细的反馈和评分。该工具支持与 LinkedIn 等平台集成,简化了面试练习流程,适用于求职者、企业培训及教学辅助等多种场景,有效提升沟通能力和面试表现。

悬河AI

悬河基于人工智能大模型,构造出一个个有知识、有个性、有风格的AI数字人虚拟人智能体。

Sierra

Sierra 是一款基于对话式 AI 的客户服务解决方案,支持多语言、语音交互和品牌一致性,可实时处理复杂客户问题并优化体验。平台具备强大的适应性和数据分析能力,适用于零售、金融、电信等多个行业,提供高效、个性化的客户支持服务。

Checksub

Checksub 是一个利用人工智能技术提供视频和音频本地化服务的平台,它通过 AI 驱动的字幕生成和配音功能,帮助用户将视频内容翻译成不同语言,从而扩大观众范围。

Miley AI

Miley AI 是一款基于人工智能的生活助手,主要功能包括智能语音记录、情绪识别、自动记账、日程管理以及与苹果健康数据连接的运动监督。这款工具特别适用于忙碌的职场人士、创意工作者、学生、健身爱好者及理财者,帮助他们更高效地管理日常生活和工作任务。

Fliki.ai

将文本变成带有 AI 语音的视频,在 2 分钟内使用逼真的声音从脚本或博客文章创建视频!

Addsubtitle

Addsubtitle 是一款基于AI的在线视频编辑工具,支持多语言视频翻译、自动字幕生成与自定义样式设置,适用于全球市场推广和内容本地化。用户可实时编辑字幕并实现精准的唇音同步,同时提供语音克隆和水印去除功能,提升视频的国际化传播能力。