MaskGCT是由趣丸科技与香港中文大学(深圳)联合研发的语音合成大模型,采用掩码生成模型与语音表征解耦编码技术,在声音克隆、跨语种合成及语音控制等领域展现出卓越性能。该模型在多个语音合成基准测试中达到行业领先水平,部分性能指标甚至超越人类表现。MaskGCT具备高效的声音克隆能力,能够快速且真实地复刻任意音色,并支持对语音时长、速度和情感的灵活调节,兼容中文、英文、日文、韩文、法文和德文等多种语言。目前,该模型已通过Amphion系统开源,向全球开发者开放。
MaskGCT是由趣丸科技与香港中文大学(深圳)联合研发的语音合成大模型,采用掩码生成模型与语音表征解耦编码技术,在声音克隆、跨语种合成及语音控制等领域展现出卓越性能。该模型在多个语音合成基准测试中达到行业领先水平,部分性能指标甚至超越人类表现。MaskGCT具备高效的声音克隆能力,能够快速且真实地复刻任意音色,并支持对语音时长、速度和情感的灵活调节,兼容中文、英文、日文、韩文、法文和德文等多种语言。目前,该模型已通过Amphion系统开源,向全球开发者开放。
发表评论 取消回复