TTS
EasyVideoTrans
EasyVideoTrans是一款开源的AI视频翻译工具,支持从视频中提取音频并翻译字幕,同时提供多样化的声音风格以实现自然的配音效果。它适用于视频创作者、教育机构、企业培训及品牌宣传等领域,能够快速生成高质量的中文版本视频,满足跨语言沟通的需求。
ebook2audiobookXTTS
ebook2audiobookXTTS是一款开源AI工具,可将EPUB、PDF、MOBI等多种电子书格式转换为高质量的有声书(.m4b)。通过集成Calibre和Coqui XTTS技术,支持多语言处理和章节识别,同时保留电子书元数据,适用于个人学习、教育培训、企业培训以及公共图书馆等场景,帮助用户高效获取知识。
Lobe Vidol
Lobe Vidol是一个开源的数字人创作平台,支持用户轻松创建和定制虚拟偶像。它具备流畅的对话交互、背景设定、动作库、角色编辑功能,还支持MMD舞蹈和PMX舞台加载。通过TTS与STT技术,Lobe Vidol实现了语音与文本的双向转换,提供沉浸式用户体验。
---
Fish Speech 1.5
Fish Speech 1.5是一款基于深度学习的文本转语音(TTS)工具,支持多语言文本输入,通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力,延迟时间短,无需依赖音素,泛化性强,且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。