智能语音

Murf AI

Murf AI 是一款文本转语音软件,它能够将真实声音与免版税音乐和视频相结合。

Aero

Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型,拥有 1.5 亿参数,专注于长音频处理,支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色,具备高效的训练方法和多任务处理能力,适用于语音助手、实时转写、归档理解等场景。

Imagine Explainers

Imagine Explainers 是一款基于 AI 的视频生成工具,支持用户根据主题和时长快速生成高质量动画视频。提供多种模板、角色和风格选择,支持 AI 语音或自定义音频。适用于教育、商业、营销等多个领域,能够将复杂内容转化为直观的视觉表达,提升信息传达效率。

小布助手

小布助手是OPPO推出的智能语音助手,支持语音交互、联网搜索、深度思考和多格式导出等功能。其网页版接入DeepSeek-R1技术,提升信息处理能力,适合日常查询、学习辅助及工作场景。支持多语言模式、语音风格选择及自定义唤醒词,满足个性化需求,适用于手机与网页端无缝衔接的使用体验。

Noiz AI

Noiz AI 是一款基于自研大模型的 AI 语音合成与克隆工具,支持 3-10 秒音频快速生成逼真语音模型,适用于 TTS、视频配音和多语言翻译。具备情感化语音输出与一键语言转换功能,广泛应用于内容创作、教育、商业及娱乐等领域,提升内容表达效果与国际化传播能力。

NEXUS

NEXUS-O是一款由多家知名机构联合开发的多模态AI模型,能够处理音频、图像、视频和文本等多种输入,并以相应形式输出结果。它在视觉理解、音频问答、语音识别和翻译等方面表现出色,具备强大的跨模态对齐与交互能力。模型基于视觉语言预训练,结合高质量音频数据提升性能,并通过多模态任务联合训练增强泛化能力。适用于智能语音助手、视频会议、教育、智能驾驶、医疗健康等多个领域。

Microsoft Dragon Copilot

Microsoft Dragon Copilot 是一款专为医疗行业设计的AI语音助手,结合语音识别与环境感知技术,支持多语言语音输入、自动化任务处理、信息检索等功能。旨在提升临床文档效率、减轻医护人员负担,并优化医疗服务流程。适用于医生、护士、行政人员及其他医疗团队成员,提升工作效率与患者体验。

TIGER

TIGER是由清华大学研发的轻量级语音分离模型,采用时频交叉建模策略与多尺度注意力机制,有效提升语音分离性能,同时显著降低计算和参数开销。模型通过频带切分优化资源利用,适应复杂声学环境,广泛应用于会议记录、视频剪辑、电影音频处理及智能语音助手等领域。

绘声美音

绘声美音是一款集声音克隆、AI变声、文字转语音及多种音频处理功能于一体的在线工具,用户可通过微信公众号便捷使用。支持上传语音训练专属声纹模型,进行歌曲翻唱并生成MV,同时提供变声、音频提取、听歌识曲等功能,适用于娱乐、配音、创作等多种场景。

Boardy

Boardy是一款基于AI与语音技术的人脉拓展工具,通过智能对话了解用户需求并提供精准推荐。支持双向确认连接,提升合作质量。内置数据可视化模块,用户可轻松创建自动更新的仪表板,适用于创业者、高管及企业用户,助力资源拓展与职业发展。