AI
OpenAudio S1
OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足
ScribbleDiff
ScribbleDiff是一种创新的文本到图像生成技术,通过涂鸦分析和传播算法,将用户简单的涂鸦转换为高质量的图像。其核心技术包括矩对齐和涂鸦传播,确保生成图像的方向一致性与细节完整性。ScribbleDiff支持多种应用场景,如艺术创作、游戏开发、教育、广告设计和UI/UX设计,为用户提供直观、高效且无须额外训练的图像生成体验。
