SnapGen是由Snap Inc、香港科技大学以及墨尔本大学等机构共同研发的文本到图像(T2I)扩散模型,能够在移动设备上高效生成高分辨率(1024×1024像素)的图像,仅需1.4秒即可完成。该模型通过379M参数实现了高性能表现,并在GenEval指标上取得了0.66的优异成绩,超过了多个参数量更大的竞争对手如SDXL和IF-XL模型。SnapGen采用了网络架构优化、跨架构知识蒸馏以及对抗性步骤蒸馏等先进技术,确保了其在移动设备上的卓越图像生成能力。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部