语音

Tolan

Tolan是一款AI驱动的陪伴应用,提供个性化对话、星球互动、照片反馈及语音交流等功能,帮助用户在日常生活中获得情感支持与互动体验。其应用场景涵盖社交娱乐、创意写作、语言学习等,适用于寻求情感陪伴或趣味互动的用户。支持多平台使用,提供灵活的订阅方案。

Ichigo

Ichigo是一款开源的多模态AI语音助手,采用混合模态模型,支持实时处理语音和文本交织序列。它通过统一的Transformer架构实现跨模态联合推理,提供低延迟的实时性能,并支持多语言、多轮对话及模糊输入处理。Ichigo适用于智能家居、个人助理、客户服务、教育和健康咨询等多种应用场景,展现了高效、灵活的技术优势。

TurboTTS

TurboTTS是一款支持多语言的在线文本转语音工具,提供300多种真实语音选择,生成自然流畅的语音效果。适用于短视频、教育、广告及播客等多种场景,操作简单,支持多种音频格式下载,并可合法用于商业用途。凭借AI技术,用户能高效完成语音内容制作,满足多样化需求。

Ondoku

Ondoku 是一款支持多语言的文字转语音工具,提供文本输入、图片文字提取及语音调整功能。用户可将文本或图片中的文字转换为自然语音,并下载为音频文件。适用于教育、娱乐、商务等多种场景,如课程讲解、有声书制作和视频配音,提升信息传播效率。

熊猫字幕

一款专业的在线字幕网站,提供自动在线字幕生成,视频音频字幕生成,字幕制作,语音转字幕,语音自动生成字幕,字幕翻译,字幕格式转换等各种字幕功能。

ElevenLabs

ElevenLabs 是一个为内容创作者和出版商提供功能强大且用途广泛的 AI 语音软件的平台。它允许用户使用其先进的多用途 AI 语音工具以任何语音和风格生成高质量的口语音频。

Audyo

Audyo是一款文本到语音的AI语音转换器,允许用户通过打字创建和编辑人类质量的AI语音。

猫头音

猫头音是一款基于深度学习技术的AI配音与翻唱工具,支持将文字转化为高质量语音输出,并提供多样化音色选择及丰富的音频处理功能。用户可通过简单操作实现个性化配音、修音翻唱以及音频编辑,广泛适用于视频创作、广告制作、有声读物开发及音乐翻唱等多个领域。

easegen

Easegen 是一款开源的 AI 工具,支持数字人课程的制作与管理。它能够批量生成 PPT 课件、克隆数字人形象和声音,并通过 AI 技术实现视频渲染和智能出题。其核心功能包括课程制作、视频管理、智能课件生成、数字人克隆及声音克隆,旨在提升教学内容的互动性和趣味性。Easegen 的技术基础涵盖人工智能、计算机视觉、自然语言处理和语音合成等,适用于在线教育、企业培训、学术研究、语言学习及职业培训