【技术实现步骤摘要】
基于语义分形的可解释GAN的图像生成训练方法及装置
[0001]本专利技术涉及人工智能
,尤其是涉及基于语义分形的可解释GAN的图像生成训练方法及装置。
技术介绍
[0002]近年来,随着生成对抗网络(Generative Adversarial Networks,GANs)的兴起和发展,从噪声数据中直接生成高保真、多样化的图片逐渐成为可能。生成对抗网络由生成器(Generator,G)和判别器(Discriminator,D)组成,生成器G的目标是将随机噪声映射为样本,判别器D的目的是判别真实样本和生成样本。GAN的训练目标是找到D和G训练过程的纳什均衡。传统的GAN研究主要集中在解决原始GAN生成图片效果不佳的问题。为此,前人已提出多种改进方式,其中可主要分为两类:第一,对GAN模型结构的修改,例如引入注意力机制的SAGAN,渐进式生成图片的ProGAN等,这些结构上的改进极大提升了GAN生成图片的分辨率和保真度;第二,模型训练过程的改进,在没有辅助训练技巧时,原始GAN的训练过程较为敏感,需要精调超参以稳定训练过 ...
【技术保护点】
【技术特征摘要】
1.一种基于语义分形的可解释GAN的图像生成训练方法,其特征在于包括如下步骤:步骤S1、通过图像训练集,基于损失函数训练生成对抗网络,得到其生成器;步骤S2、获取图像经由生成器中层输出的第一特征图,对第一特征图进行语义化分形;步骤S3、根据语义分形结果,对生成对抗网络的中层特征构建分形损失,包括以下步骤:步骤S3.1、获取第一特征图基于语义分形规则划分的分形结果;步骤S3.2、获取图像经由生成器中层输出的第二特征图,并将第二特征图与分形结果的匹配程度作为分形损失,以使第二特征图的分形向第一特征图靠近;步骤S4、基于分形损失与生成对抗网络原有的损失函数,联合优化生成对抗网络,进行图像生成的训练。2.根据权利要求1所述的基于语义分形的可解释GAN的图像生成训练方法,其特征在于:所述步骤S2包括如下步骤:步骤S2.1、设计特征图的语义化分形规则;采用将每个分形看做一个类的方式,基于最小化类内方差且最大化类间距离的原则,将特征图划分成若干个分形,分形之间互不重叠;步骤S2.2、基于分形规则对第一特征图进行迭代划分。3.根据权利要求2所述的基于语义分形的可解释GAN的图像生成训练方法,其特征在于:所述步骤S2中,第一特征图为经过激活的特征图,分形规则是按照特征图激活值的分布划分为若干个分形。4.根据权利要求3所述的基于语义分形的可解释GAN的图像生成训练方法,其特征在于:所述步骤S2.2中,每次迭代都在当前分形中找到面积大且激活值方差大的分形,按照最小化类内方差的原则一分为二。5.根据权利要求4所述的基于语义分形的可解释GAN的图像生成训练方法,其特征在于:所述最小化类内方差的原则一分为二,公式如下:其中,和分别表示划分后两块...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。