PixelHacker是由华中科技大学与VIVO AI Lab联合研发的图像修复模型。该模型采用潜在类别引导(Latent Categories Guidance, LCG)机制,分别对图像的前景和背景进行编码,并通过线性注意力机制将特征注入去噪过程,从而实现结构与语义的一致性。模型基于包含1400万张图像-掩码对的大规模数据集进行预训练,并在多个开源基准数据集(如Places2、CelebA-HQ和FFHQ)上进行微调,显著提升了修复效果。 PixelHacker具备多项核心功能,包括高质量图像修复、结构与语义一致性保障以及多场景适应能力。其技术架构基于扩散模型,结合多步交互机制与分类器自由引导(CFG),以提升生成内容的质量与多样性。该工具适用于多种应用场景,如老旧照片修复、无关对象移除、创意内容生成、医学影像处理及文化遗产保护等。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部