当前位置: 首页 > 专利查询>之江实验室专利>正文

基于语义分形的可解释GAN的图像生成训练方法及装置制造方法及图纸

技术编号:35840529 阅读:27 留言:0更新日期:2022-12-03 14:12
本发明专利技术公开了基于语义分形的可解释GAN的图像生成训练方法及装置,将传统的GAN模型修改为一个可解释的GAN,使得其高层的特征表示是明确且一致的;在可解释GAN中,同一层的所有滤波器“学习着”被相同的部分激活,从而使得GAN内部的特征表示清晰且一致的语义信息;本发明专利技术在无需额外标注,仅使用正常的训练样本的情况下,设计分形损失函数,约束GAN的特征表达,使其自动地学习关注物体重要的部分;通过同时优化GAN原本损失函数与分形损失函数,在提升GAN内部特征可解释性的同时,也保证了GAN生成图片的质量。生成图片的质量。生成图片的质量。

【技术实现步骤摘要】
基于语义分形的可解释GAN的图像生成训练方法及装置


[0001]本专利技术涉及人工智能
,尤其是涉及基于语义分形的可解释GAN的图像生成训练方法及装置。

技术介绍

[0002]近年来,随着生成对抗网络(Generative Adversarial Networks,GANs)的兴起和发展,从噪声数据中直接生成高保真、多样化的图片逐渐成为可能。生成对抗网络由生成器(Generator,G)和判别器(Discriminator,D)组成,生成器G的目标是将随机噪声映射为样本,判别器D的目的是判别真实样本和生成样本。GAN的训练目标是找到D和G训练过程的纳什均衡。传统的GAN研究主要集中在解决原始GAN生成图片效果不佳的问题。为此,前人已提出多种改进方式,其中可主要分为两类:第一,对GAN模型结构的修改,例如引入注意力机制的SAGAN,渐进式生成图片的ProGAN等,这些结构上的改进极大提升了GAN生成图片的分辨率和保真度;第二,模型训练过程的改进,在没有辅助训练技巧时,原始GAN的训练过程较为敏感,需要精调超参以稳定训练过程,因而,改进原始G本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于语义分形的可解释GAN的图像生成训练方法,其特征在于包括如下步骤:步骤S1、通过图像训练集,基于损失函数训练生成对抗网络,得到其生成器;步骤S2、获取图像经由生成器中层输出的第一特征图,对第一特征图进行语义化分形;步骤S3、根据语义分形结果,对生成对抗网络的中层特征构建分形损失,包括以下步骤:步骤S3.1、获取第一特征图基于语义分形规则划分的分形结果;步骤S3.2、获取图像经由生成器中层输出的第二特征图,并将第二特征图与分形结果的匹配程度作为分形损失,以使第二特征图的分形向第一特征图靠近;步骤S4、基于分形损失与生成对抗网络原有的损失函数,联合优化生成对抗网络,进行图像生成的训练。2.根据权利要求1所述的基于语义分形的可解释GAN的图像生成训练方法,其特征在于:所述步骤S2包括如下步骤:步骤S2.1、设计特征图的语义化分形规则;采用将每个分形看做一个类的方式,基于最小化类内方差且最大化类间距离的原则,将特征图划分成若干个分形,分形之间互不重叠;步骤S2.2、基于分形规则对第一特征图进行迭代划分。3.根据权利要求2所述的基于语义分形的可解释GAN的图像生成训练方法,其特征在于:所述步骤S2中,第一特征图为经过激活的特征图,分形规则是按照特征图激活值的分布划分为若干个分形。4.根据权利要求3所述的基于语义分形的可解释GAN的图像生成训练方法,其特征在于:所述步骤S2.2中,每次迭代都在当前分形中找到面积大且激活值方差大的分形,按照最小化类内方差的原则一分为二。5.根据权利要求4所述的基于语义分形的可解释GAN的图像生成训练方法,其特征在于:所述最小化类内方差的原则一分为二,公式如下:其中,和分别表示划分后两块...

【专利技术属性】
技术研发人员:李超王劲
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1