语音

VoltAgent

VoltAgent 是一个开源的 TypeScript 框架,用于构建和编排 AI Agent。它提供基础架构和工具,简化与大语言模型的交互、状态管理、外部工具连接及工作流编排。支持多 Agent 系统、记忆管理、RAG 技术、语音交互等功能,并具备可视化监控和灵活的 LLM 支持,适用于智能客服、数据处理、语音控制等多种场景。

Rask.ai

Rask.ai平台以其自动化和智能化的翻译及配音服务,帮助企业节省时间和成本,同时提高内容的全球可访问性。

Insighto.ai

Insighto.ai是一个基于人工智能的通信平台,支持多语言对话、24/7客户支持及跨渠道互动。其核心功能包括语音和文本交互、个性化客户体验、CRM集成以及无代码构建能力,广泛应用于客户服务、销售、预约管理等领域,助力企业提升运营效率和客户满意度。

Omnivore

一款免费、开源、适合认真阅读的稍后阅读应用程序。不受干扰。注重隐私。开源。专为知识工作者和终身学习者而设计。

DupDub

DupDub是一款由出门问问开发的AI内容生成平台,集成了AI写作、文本转语音、视频编辑等多项功能,支持70多种语言和500多种真实语音效果。它通过简化创作流程,帮助内容创作者快速生成高质量的视频、文本和音频内容,适用于营销、教育、无障碍辅助等多种应用场景,有效提升工作效率与内容影响力。

Murf AI

Murf AI 是一款文本转语音软件,它能够将真实声音与免版税音乐和视频相结合。

MiniMax Audio

MiniMax Audio是一款基于人工智能的语音合成工具,支持多语言、多情感及声音克隆功能,可将文本快速转换为自然流畅的语音。它具备降噪、超长文本合成、实时语音生成等特性,适用于视频配音、播客制作、游戏配音等多种应用场景。

SeniorTalk

SeniorTalk是全球首个面向中文超高龄老年人的语音数据集,涵盖202位75岁以上老人的55.53小时语音数据,覆盖16个省市,包含多种口音。数据通过两两自发对话采集,内容贴近真实交流场景,并附有多维标注,如说话人信息、时间戳、口音分类等。该数据集可用于语音识别、说话人验证、语音编辑等研究,支持适老化设备、健康管理和辅助养老系统的开发,推动相关技术进步。

出门问问

出门问问,一家以生成式AI与语音交互为核心的人工智能公司。

Mahilo

Mahilo 是一款支持多智能体协作的框架,具备实时语音与文本通信能力,支持智能体间共享上下文并接受人类监督。其提供灵活的通信模式和策略管理功能,适用于客户服务、紧急响应、内容创作、医疗协调等多个场景。通过标准化的消息协议和可扩展的架构,Mahilo 提升了人机协作效率与决策质量。