一种基于双判别器加权生成对抗网络的手写数字生成方法技术

技术编号:27937660 阅读:162 留言:0更新日期:2021-04-02 14:18
本发明专利技术公开了一种基于双判别器加权生成对抗网络的手写数字生成方法,涉及深度学习技术领域,针对D2GAN存在的技术问题,本申请提出了一种基于双判别器加权生成对抗网络的手写数字生成方法,引入加权思想构建新的目标函数,从损失函数角度避免梯度消失的现象出现;结合正向KL散度和反向KL散度的优势,使生成的模式多样化,改善了GAN所出现的模式崩溃问题。

【技术实现步骤摘要】
一种基于双判别器加权生成对抗网络的手写数字生成方法
本专利技术涉及深度学习
,特别涉及一种基于双判别器加权生成对抗网络的手写数字生成方法。
技术介绍
生成对抗网络(GenerativeAdversarialNetworks,GAN)是近几年发展起来的一种对抗性学习方法。GAN由一个生成器G和一个判别器D构成,采用博弈论的思想,二者互相博弈,其目标是在具有高维参数的连续非凸问题中找到纳什均衡(Nashequilibrium)。GAN被证明可以生成逼真的图像,在数据增强、图像补全方面很有帮助,主要应用在图像超分辨率重建、迁移学习、图像修复等领域。但在给定一个最优的判别器时,生成器的损失函数等价于最小化真实数据Pdata(x)与生成样本Pg(z)之间的JS散度(Jensen-Shannon)。在高维空间中两个分布很难相交,即使相交,其相交部分是高维空间中的一个低维流形,测度为0,相交部分可以忽略不计,此时,JS散度为常数,出现梯度消失的问题。为解决此问题,Goodfellow等人重新定义了生成器的损失函数-log(D(G(z)))。虽然,梯度消失问题得到了解决,但是,目标函数中存在最小化KL散度和最大化JS散度的矛盾,使生成器训练不稳定,并且生成的样本大部分是一些重复安全的样本,缺乏多样性,导致生成的图像趋于一致而多样性降低,生成的样本种类匮乏,从而出现模式崩溃问题。针对GAN存在的模式崩溃问题,现有技术中有人提出了D2GAN算法,引入双判别器的思想,试图在目标函数中综合利用KL散度和反向KL散度,以平衡生成器与判别器的对抗。其目标函数引入了超参数α、β,有两个目的:一是为了稳定模型的学习,通过减小α、β来分别降低-D1(G(z))和-D2(x)对优化的影响;二是通过增大α、β,分别鼓励最小化KL散度和反向KL散度。与GAN算法类似,超参数的引入虽然对于模型稳定和模式崩溃具有缓解作用,但是超参数的减小和增大是矛盾的,使得两个功能是可以相互抵消,从而使生成器训练不稳定。D2GAN引入双判别器,试图解决GAN的模式崩溃问题,但没有给出超参数明确的指导性建议,其生成器可以学习到大多数的分布,但仍有部分分布被遗忘。因此,本申请提出了一种基于双判别器加权生成对抗网络的手写数字生成方法,引入加权思想构建新的目标函数,从损失函数角度避免梯度消失的现象出现;结合正向KL散度和反向KL散度的优势,使生成的模式多样化,改善了GAN所出现的模式崩溃问题。
技术实现思路
本专利技术的目的在于提供一种基于双判别器加权生成对抗网络的手写数字生成方法,引入加权思想构建新的目标函数,从损失函数角度避免梯度消失的现象出现;结合正向KL散度和反向KL散度的优势,使生成的模式多样化,改善了GAN所出现的模式崩溃问题。本专利技术提供了一种基于双判别器加权生成对抗网络的手写数字生成方法,包括以下步骤:S1:建立D2WGAN网络模型,所述D2WGAN网络模型由生成器G、判别器D1和判别器D2组成,所述D2WGAN网络模型通过反向传播进行训练;S2:对D2WGAN网络模型进行理论分析,验证在最优判别器下,通过最小化模型与真实数据之间的KL散度和反向KL散度,生成器恢复生成手写数字的真实数据。进一步地,所述步骤S1训练过程具体为:S11:采用MNIST数据集作为训练样本;S12:搭建生成器和判别器模型;S13:建立判别器和生成器的损失函数;S14:训练生成器和判别器模型。进一步地,所述步骤S12中生成器和判别器的输入输出关系如下所示:生成器的输入输出表达关系为:其中:T(G)表示生成网络G的输出,为从噪声空间Pz中采样出m个样本;判别器D1的输入输出表达关系为:其中:T(D1)表示判别网络D1的输出,为从真实数据空间Pdata中采样出m个样本;判别器D2的输入输出表达关系为:其中:T(D2)表示判别网络D2的输出。进一步地,所述步骤S13中首先获得生成器和判别器的输入,生成器的输入为噪声z,z满足随机噪声分布Pz,判别器的输入包括生成器生成的样本以及真实数据样本x,将噪声数据输入生成器得到G(z),将生成器生成的样本G(z)分别输入到判别器D1和判别器D2得到D1(G(z)和D2(G(z),将真实数据x输入到判别器D1和判别器D2得到D1(x)和D2(x);判别器的损失函数为:Loss_D=Loss_D1+Loss_D2(6)其中:Loss_D1为判别器D1的损失函数,Loss_D2为判别器D2的损失函数,Loss_D为总的判别器的损失函数,两个超参数之间的关系为:0≤ω≤1且ρ+ω=1判别器D1主要侧重于真实数据,判别器D2主要侧重于生成器生成的数据,两个判别器之间通过加权连接;生成器的损失函数为:进一步地,所述步骤S14中训练过程中采用Adam优化器进行训练,其公式如下:mt=μ*mt-1+(1-μ)*gt(8)进一步地,所述步骤S1中的所述判别器D1和判别器D2均为多层感知器,所述D2WGAN网络模型的目标函数由正向目标函数和反向目标函数两部分加权组成,目标函数形式如下:引入超参数ρ和ω,ρ和ω分别为正向和反向目标函数的权重;其中ρ+ω=1且0≤ρ,ω≤1;正向目标函数为:反向目标函数为:当ρ=1,ω=0时,D2WGAN算法退化为正向目标函数,目标函数为:最优判别器为:在最优判别器基础上,最优生成器为:当ρ=0,ω=1时,D2WGAN算法退化为反向目标函数,即目标函数为:最优判别器为:在最优判别器基础上,最优生成器为:D2WGAN在正向和反向目标函数都存在时,即0<ρ,ω<1且ρ+ω=1时,网络根据对单一和多样模式的侧重程度不同,相当于KL散度和反向KL散度的加权融合,利用两个散度的互补特性,在生成多种模式的基础上避免不良样本的生成。进一步地,所述步骤S2给定一个固定的G,将T(G,D1,D2)最大化,得出以下闭合形式的最优判别器进一步地,所述步骤S2给定和在纳什平衡下,当且仅当PG=Pdata时,达到全局最小;其中,与现有技术相比,本专利技术具有如下显著优点:(1)本专利技术相较于D2GAN目标函数不同、思想不同。D2WGAN引入加权思想,使网络有所侧重,侧重改善D2GAN中超参数的启发式缺陷,从而对正向和反向KL散度融合互补,在生成多种模式的基础上避免不良样本的生成,可有效解决模式崩溃问题。两者目标函数中超参数的引入目的不同。D2WGAN引入超参数是为了对正向和反向KL散度进行侧重加权,而D2GAN引入目的是为了稳定模型,降低-D1(G(z))和-D2(x)以及控制正向和反向KL散度本文档来自技高网
...

【技术保护点】
1.一种基于双判别器加权生成对抗网络的手写数字生成方法,其特征在于,包括以下步骤:/nS1:建立D2WGAN网络模型,所述D2WGAN网络模型由生成器G、判别器D

【技术特征摘要】
1.一种基于双判别器加权生成对抗网络的手写数字生成方法,其特征在于,包括以下步骤:
S1:建立D2WGAN网络模型,所述D2WGAN网络模型由生成器G、判别器D1和判别器D2组成,所述D2WGAN网络模型通过反向传播进行训练;
S2:对D2WGAN网络模型进行理论分析,验证在最优判别器下,通过最小化模型与真实数据之间的KL散度和反向KL散度,生成器恢复生成手写数字的真实数据。


2.如权利要求1所述的一种基于双判别器加权生成对抗网络的手写数字生成方法,其特征在于,所述步骤S1训练过程具体为:
S11:采用MNIST数据集作为训练样本;
S12:搭建生成器和判别器模型;
S13:建立判别器和生成器的损失函数;
S14:训练生成器和判别器模型。


3.如权利要求2所述的一种基于双判别器加权生成对抗网络的手写数字生成方法,其特征在于,所述步骤S12中生成器和判别器的输入输出关系如下所示:
生成器的输入输出表达关系为:
其中:T(G)表示生成网络G的输出,为从噪声空间Pz中采样出m个样本;
判别器D1的输入输出表达关系为:
其中:T(D1)表示判别网络D1的输出,为从真实数据空间Pdata中采样出m个样本;
判别器D2的输入输出表达关系为:
其中:T(D2)表示判别网络D2的输出。


4.如权利要求2所述的一种基于双判别器加权生成对抗网络的手写数字生成方法,其特征在于,所述步骤S13中首先获得生成器和判别器的输入,生成器的输入为噪声z,z满足随机噪声分布Pz,判别器的输入包括生成器生成的样本以及真实数据样本x,将噪声数据输入生成器得到G(z),将生成器生成的样本G(z)分别输入到判别器D1和判别器D2得到D1(G(z)和D2(G(z),将真实数据x输入到判别器D1和判别器D2得到D1(x)和D2(x);
判别器的损失函数为:






Loss_D=Loss_D1+Loss_D2(6)
其中:Loss_D1为判别器D1的损失函数,Loss_D2为判别器D2的损失函数,Loss_D为总的判别器的损失函数,两个超参数之间的关系为:0≤ω≤1且ρ+ω=1判别器D1主要侧重于真实数据,判别器D2主要...

【专利技术属性】
技术研发人员:刘宝高娜黄梦涛刘海闫洪霖张金玉宋美玉王良师露露翟晓航
申请(专利权)人:西安科技大学陕西中一时代科技有限公司
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1