The invention belongs to the field of image reconstruction technology, and discloses a method of solving model collapse by using perceptual loss based on generating antagonistic network. Random vector Z is used to generate images similar to the actual data distribution. In the training process, perceptual loss is used to map Z and real data into feature space to extract higher-level features, and combined with antagonistic loss to encourage generation network. The network generates image samples similar to the actual image; finally, the discriminator can not judge that this is a false image. The method solves the problem of model collapse by using smaller data sets for existing networks, and VGG GAN is evaluated on two small scene data sets. The experimental results show that the image quality generated by VGG GAN method is better than the existing method.
【技术实现步骤摘要】
一种基于生成对抗网络使用感知损失解决模型崩塌的方法
本专利技术属于图像重建
,尤其涉及一种基于生成对抗网络使用感知损失解决模型崩塌的方法。具体涉及一种基于生成对抗网络使用感知损失解决模型崩塌的方法VGG-GAN。
技术介绍
目前,业内常用的现有技术是这样的:传统生成对抗网络GAN有生成器网络和鉴别器网络组成。训练GAN使生成器网络和鉴别器网络相互竞争达到最优的过程,即达到纳什均衡。然而,目前并没有一个明确的方法来确定GAN网络是否已经进入纳什平衡。该问题是一个高维非凸优化目标。网络试图在下一步中最小化非凸优化目标,这最终可能导致振荡,而不是收敛到底层的真实目标。只要一个生成器和鉴别器不再改变,任何一方不会进一步改进。从梯度下降开始,选择一个可微的损失函数,并最小化它。GAN应用广泛,但存在训练不稳定、梯度消失、模型崩溃等问题。例如,当GAN训练不稳定时,实验的结果会很差,即使训练增加训练的时间也不会让最终的结果改进。众所周知,最优的D旨在最大化真实数据分布与生成的样本分布之间的Jensen-Shannon(JS)偏差。理论上,高维空间中两个分布之间的JS距离的最大概率是常数。当优化的目标是常数时,对于最优鉴别器,生成器不能得到任何的梯度信息。即使对于接近最优的鉴别器,生成器也有很大的可能来面对梯度消失的问题。模型崩溃被称为GAN网络中最重要的失败模式。生成器重复产生完全相同的图像,本专利技术称之为模式崩溃。一般来说,现实世界的数据分布是高度复杂和多模态的。数据描述的概率分布具有多重性。由不同的子组样本集中。生成器崩塌到一个非常狭窄的分布,并导致生成的 ...
【技术保护点】
1.一种基于生成对抗网络使用感知损失解决模型崩塌的方法,其特征在于,所述基于生成对抗网络使用感知损失解决模型崩塌的方法包括以下步骤:输入待训练的图像I;将待训练图像I转为m×m的图像块集合,图像块用Idata表示;随机产生满足高斯分布或均匀分布的噪声z;将噪声z输入到生成器G中进行训练;将生成器G输出的结果Iz和Idata一同输入到鉴别器D中;生成器和鉴别器不断更新学习,直到达到纳什平衡,生成类似于真实图像的样本图像。
【技术特征摘要】
1.一种基于生成对抗网络使用感知损失解决模型崩塌的方法,其特征在于,所述基于生成对抗网络使用感知损失解决模型崩塌的方法包括以下步骤:输入待训练的图像I;将待训练图像I转为m×m的图像块集合,图像块用Idata表示;随机产生满足高斯分布或均匀分布的噪声z;将噪声z输入到生成器G中进行训练;将生成器G输出的结果Iz和Idata一同输入到鉴别器D中;生成器和鉴别器不断更新学习,直到达到纳什平衡,生成类似于真实图像的样本图像。2.如权利要求1所述的基于生成对抗网络使用感知损失解决模型崩塌的方法,其特征在于,所述将随机噪声z输入到生成器G中进行训练,包括以下步骤:对z做全连接处理;然后reshape成512个特征映射的高维张量;输出的特征图经过四个大小为5*5反卷积处理,随后归一化处理,再经过ReLU激活函数;输出生成的图像。3.如权利要求1所述的基于生成对抗网络使用感知损失解决模型崩塌的方法,其特征在于,所述将生成器G输出的结果Iz和Idata一同输入到鉴别器D中,包括以下步骤:经过四次大小为5*5的卷积核,对图像做卷积处理;随后归一化处理,再经过LeakyReLU激活函数;将得到的结果构造一个全连接隐藏层得到一维的数组,进行非线性激活输出结果,判断图像是来自生成器Iz还是图像块Idata。4.如权利要求2所述的基于生成对抗网络使用感知损失解决模型崩塌的方法,其特征在于,所述将随机噪声z输入到生成器G中进行训练,具体包括:1)对z作全连接处理,输出为64*8192;2)然后reshape成512个特征映射的高维张量;3)用大小为5×5,步长为2的反卷积,每个卷积层的输出归一化处理再经过ReLU激活函数,ReLU函数如下表示:f(x)=max(0,x)当输入信号小于0时,输出为0,当输入信号大于0时,输出等...
【专利技术属性】
技术研发人员:李孝杰,伍贤宇,冯诗皓,史沧红,罗超,张宪,刘书樵,李俊良,
申请(专利权)人:成都信息工程大学,
类型:发明
国别省市:四川,51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。