基于语义分形的可解释GAN的图像生成训练方法及装置制造方法及图纸

技术编号：35840529 阅读：27 留言：0更新日期：2022-12-03 14:12

本发明专利技术公开了基于语义分形的可解释GAN的图像生成训练方法及装置，将传统的GAN模型修改为一个可解释的GAN，使得其高层的特征表示是明确且一致的；在可解释GAN中，同一层的所有滤波器“学习着”被相同的部分激活，从而使得GAN内部的特征表示清晰且一致的语义信息；本发明专利技术在无需额外标注，仅使用正常的训练样本的情况下，设计分形损失函数，约束GAN的特征表达，使其自动地学习关注物体重要的部分；通过同时优化GAN原本损失函数与分形损失函数，在提升GAN内部特征可解释性的同时，也保证了GAN生成图片的质量。生成图片的质量。生成图片的质量。

全部详细技术资料下载

【技术实现步骤摘要】
基于语义分形的可解释GAN的图像生成训练方法及装置

[0001]本专利技术涉及人工智能
，尤其是涉及基于语义分形的可解释GAN的图像生成训练方法及装置。

技术介绍

[0002]近年来，随着生成对抗网络（Generative Adversarial Networks，GANs）的兴起和发展，从噪声数据中直接生成高保真、多样化的图片逐渐成为可能。生成对抗网络由生成器（Generator，G）和判别器（Discriminator，D）组成，生成器G的目标是将随机噪声映射为样本，判别器D的目的是判别真实样本和生成样本。GAN的训练目标是找到D和G训练过程的纳什均衡。传统的GAN研究主要集中在解决原始GAN生成图片效果不佳的问题。为此，前人已提出多种改进方式，其中可主要分为两类：第一，对GAN模型结构的修改，例如引入注意力机制的SAGAN，渐进式生成图片的ProGAN等，这些结构上的改进极大提升了GAN生成图片的分辨率和保真度；第二，模型训练过程的改进，在没有辅助训练技巧时，原始GAN的训练过程较为敏感，需要精调超参以稳定训练过...

【技术保护点】

【技术特征摘要】
1.一种基于语义分形的可解释GAN的图像生成训练方法，其特征在于包括如下步骤：步骤S1、通过图像训练集，基于损失函数训练生成对抗网络，得到其生成器；步骤S2、获取图像经由生成器中层输出的第一特征图，对第一特征图进行语义化分形；步骤S3、根据语义分形结果，对生成对抗网络的中层特征构建分形损失，包括以下步骤：步骤S3.1、获取第一特征图基于语义分形规则划分的分形结果；步骤S3.2、获取图像经由生成器中层输出的第二特征图，并将第二特征图与分形结果的匹配程度作为分形损失，以使第二特征图的分形向第一特征图靠近；步骤S4、基于分形损失与生成对抗网络原有的损失函数，联合优化生成对抗网络，进行图像生成的训练。2.根据权利要求1所述的基于语义分形的可解释GAN的图像生成训练方法，其特征在于：所述步骤S2包括如下步骤：步骤S2.1、设计特征图的语义化分形规则；采用将每个分形看做一个类的方式，基于最小化类内方差且最大化类间距离的原则，将特征图划分成若干个分形，分形之间互不重叠；步骤S2.2、基于分形规则对第一特征图进行迭代划分。3.根据权利要求2所述的基于语义分形的可解释GAN的图像生成训练方法，其特征在于：所述步骤S2中，第一特征图为经过激活的特征图，分形规则是按照特征图激活值的分布划分为若干个分形。4.根据权利要求3所述的基于语义分形的可解释GAN的图像生成训练方法，其特征在于：所述步骤S2.2中，每次迭代都在当前分形中找到面积大且激活值方差大的分形，按照最小化类内方差的原则一分为二。5.根据权利要求4所述的基于语义分形的可解释GAN的图像生成训练方法，其特征在于：所述最小化类内方差的原则一分为二，公式如下：其中，和分别表示划分后两块...

【专利技术属性】
技术研发人员：李超，王劲，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人