一种考虑统计全局信息的多目标演化生成对抗网络制造技术

技术编号:38435590 阅读:10 留言:0更新日期:2023-08-11 14:20
本发明专利技术公开了一种考虑统计全局信息的多目标演化生成对抗网络,在多目标演化算法与生成对抗网络结合的基础上,构建浅层的神经网络统计非局部性的信息,将自注意力机制模块从通道域方面进行修改,把修改之后的自注意力机制模块加入到生成器的第三层和第四层卷积网络之间;对鉴别器进行进一步的约束,将谱归一化加入到鉴别器的每一层神经网络中代替传统的批归一化;将余弦退火算法替代传统的学习率更新策略,在每次对生成器进行更新后都要根据生成样本的质量和多样性两个目标在生成器的种群中来选出最优解,以进行下一步的迭代更新,需要修改原有的拥挤度比较算子,使其同时考虑不同维度的影响,得到最优解。得到最优解。得到最优解。

【技术实现步骤摘要】
一种考虑统计全局信息的多目标演化生成对抗网络


[0001]本专利技术同时涉及了生成对抗网络和多目标演化算法,并考虑将二者结合起来,具体为一种考虑统计全局信息的多目标演化生成对抗网络。

技术介绍

[0002]生成对抗网络(GANs)就被应用在了诸多领域,其凭借着自己强大的对抗学习能力受到了越来越多人的关注。
[0003]生成对抗网络除了常见的应用还被应用在其他领域,比如医学方面。而面对着合成任务不断的复杂化,传统的生成对抗网络及其变体在真实应用中遇到了诸多困难,如训练的不稳定性、模型鲁棒性低、出现模式崩溃等。
[0004]而多目标演化算法能够应用在求解多目标领域,考虑到GAN的训练动荡、并且在训练过程中呈现的模式崩溃等现状,所以可以将多目标演化算法应用到生成对抗网络中,在此种新的GAN的框架下,在其性能提高的同时,也可以使训练变得更稳定。
[0005]原始的GAN以及GAN的大多数变体都是从目标函数入手,采用预先定义的对抗目标函数交替训练生成器和鉴别器。而多目标演化的GAN可以同时将生成样本的质量以及多样性来作为目标,可演化一个生成器种群。突变操作采用不同的对抗性训练目标,每个生成器的候选根据这些突变进行更新。而现有的GAN的多目标演化存在着训练不稳定、模型鲁棒性低,最优解选取不合理等问题。
[0006]全局信息统计的多目标演化生成对抗网络主要考虑以下三个问题:(1)模式崩塌问题:和其他的神经网络不同的是,GAN由两个重要的部分组成,一个重要部分是生成器,再一部分是鉴别器,需要两者同时进化,复杂程度大大提升。总的来说对于GAN在这一完整的训练过程中所遇到的模式崩溃问题的研究工作还在大幅度的展开,从多方面对该问题进行了剖析,但还需要形成一套系统的东西来对该问题进行解释说明。(2)模型鲁棒性差:生成对抗网络在计算机视觉方面的应用主要依赖于已经训练好的网络进行,而训练出来的模型,稍微修改参数,或弱化生成器的功能等就会造成整个训练过程的崩溃,达不到事先对效果的期待,由此可见模型的鲁棒性低。(3)训练不稳定问题:因其不同于传统的神经网络,GAN由两个重要的部分组成,一个重要的部分是生成器,再一部分是鉴别器,而且需要二者同时进行训练,生成器会依照鉴别器所产生的鉴别结果更新优化,反过来,鉴别器也会依照生成器的结果来更新,所以要使二者在达到平衡的同时,还均是最优状态是很难的。
[0007]每个单个的对抗目标总是有缺陷,对于不同的数据集或对于同一个实验中的不同阶段而言,是无法明确的评定某一特定的训练策略就有明显的优势。考虑将生成器进行修改,将鉴别器视为一个环境,生成器是一个种群,种群根据环境进行演化,经历不同的突变,使用不同的对抗目标函数来产生适应环境的后代。针对卷积很难取得良好的结果,本专利技术构建了一种新的模型,称为浅层的全局信息统计的多目标演化生成对抗网络,该模型使用较浅层的卷积网络捕获了长范围的特征依赖,统计了非局部性的全局信息。在根本上分析了造成梯度消失和在训练过程中所产生的动荡现状的原因,考虑将鉴别器进行进一步的约
束,对生成器进行批归一化处理的同时,摒弃传统的对鉴别器也进行批归一化处理的方式,使用谱归一化进一步对鉴别器进行约束,除此之外,为了防止训练过程找到假的“最优值”,即是一个局部性的最优解,使用了新的学习率策略,为了控制其衰减速率,设置特定值,并在该值处使学习率上升到衰减的初始值,可以很好的使模型冲出局部最优解。并且针对最优解的选择过程考虑将拥挤度算子进行改进,考虑到不同维度的影响。

技术实现思路

[0008]本专利技术的目标是对多目标演化算法进行改良,使其更加合理化的选择最优解,利用多目标演化算法的优势,缓解模型鲁棒性低的问题。建立生成器和鉴别器新的归一化实施方法,并且改进生成器和鉴别器的学习率更新策略,在缓解模式崩塌问题和模型鲁棒性低的问题的基础上,使一方面生成样本的品质和另一方面其多样性有较大幅度的提升,并且使这一个完整的训练过程不易震荡,即增加稳定性。
[0009]本专利技术的技术方案:
[0010]一种考虑统计全局信息的多目标演化生成对抗网络,包括:
[0011]将多目标演化算法应用到生成对抗网络中,构建浅层的神经网络统计非局部性的信息,将自注意力从通道域方面进行修改,把修改之后的自注意力机制模块加入到生成器的第三层和第四层卷积网络之间,考虑在生成器中加入了新的模块后,需要更加严格的约束鉴别器,所以将谱归一化加入到鉴别器的每一层神经网络中代替传统的批归一化。为了防止在生成器和鉴别器的更新过程中会陷入局部最优解,所以将余弦退火算法替代传统的学习率更新策略,在每次对生成器进行更新后都要根据生成样本的质量和多样性两个目标在生成器的种群中来选出最优解,以进行下一步的迭代更新,然而现有演化算法中的拥挤度算子并未考虑不同维度的影响,所以需要修改原有的拥挤度比较算子,使其同时考虑不同维度的影响,得到最优解。
[0012]设计浅层的神经网络统计非局部性的信息,包括:
[0013]用浅层的卷积当根底,构建轻型的神经网络统计非局部性的信息,可以获得到更加广泛的特征。在考虑到已有的生成对抗网络的变种中只能根据局部性的特征来生成细节,若想统计全局信息,获得更深层次的特征依赖就得使用深层的神经网络,会导致训练效率降低,并且太深层次的网络,不利于梯度的反向传播,当需要远距离传递消息时,卷积就很难取得良好的效果。考虑到注意力机制可以统计非局部性的信息,所以选择对自注意力机制模块改良优化,从通道域和空间域的角度出发来增强模型的全局信息处理能力。并将改进后的模块融合到生成对抗网络中。
[0014]首先,自注意力机制模块将经过卷积之后所得到的特征图x分为三部分,分别是K、Q和Temp。
[0015]由卷积网络部分得到特征图x,在得到的特征图x中为了计算注意力值它被转换成Q和K这两个不同的特征空间,其中Q(x)=Wqx,K(x)=W
k
x。
[0016][0017]其中,βj,i表示在生成j这一块的时候,对i部分给予了多大的关注值;C作为前面输入的x的通道的数目,N表示前面所输入的特征图x中所包含的像素点的个数;最后输出是
其中:
[0018][0019]在上述的公式中:分别从通道域和空间域两个不同的方向考虑,重新定义了W
K
、WQ、W
T
和W
V
的不同规格即权重矩阵的大小不同,其中的不同规格即权重矩阵的大小不同,其中它们都被实现为1*1的卷积;
[0020]最后的输出由下列公式进行计算:
[0021]yi=γoi+xi,(3)
[0022]整个学习过程是由容易到复杂。
[0023]将谱归一化加入到鉴别器中,并且使用余弦退火算法替代传统的学习率更新策略,包括:
[0024]矩阵W的谱系数σ(W)的物理含义是:对于任意的输入向量z,经过W的线性变换对z向量可能的最大的拉伸系数。如果一个神经网络的参数矩阵谱系数被限制在小于1的时候,它对于任意的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种考虑统计全局信息的多目标演化生成对抗网络,其特征在于,以多目标演化算法与生成对抗网络结合为基础在此之上,构建浅层的神经网络统计非局部性的信息,将自注意力机制模块从通道域和空间域进行修改,把修改之后的自注意力机制模块加入到生成器的第三层和第四层卷积网络之间;考虑在生成器中增加了修改过后的自注意力机制这一模块后,需要对鉴别器进行进一步的约束,所以将谱归一化加入到鉴别器的每一层神经网络中代替传统的批归一化;为了防止在生成器和鉴别器的更新过程中会陷入局部最优解,所以将余弦退火算法替代传统的学习率更新策略,在每次对生成器进行更新后都要根据生成样本的质量和多样性两个目标在生成器的种群中来选出最优解,以进行下一步的迭代更新,然而现有演化算法中的拥挤度算子并未考虑不同维度的影响,所以需要修改原有的拥挤度比较算子,使其同时考虑不同维度的影响,得到最优解;(1)构建浅层的神经网络统计非局部性的信息生成对抗网络的生成器和鉴别器都以四层的卷积神经网络为基础,在生成器中构建轻型的神经网络统计非局部性的信息,捕获长范围的特征依赖;考虑到注意力机制可统计非局部性的信息,对自注意力机制模块进行改良,从通道域和空间域的角度出发来改变自注意力机制的权重矩阵的规格,将改进后的自注意力机制模块加入到生成器的第三层和第四层卷积网络之间,卷积神经网络的前三层分别使用的激活函数是“ReLU”,第一层的步长为1,剩下三层的步长均为2,在第三层和第四层之间加入可捕获全局信息的改进后的自注意力机制模块,第四层的卷积神经网络所使用的激活函数在这里是“Tanh”;对自注意力机制模块的改进细节具体如下:首先,自注意力机制模块将经过卷积神经网络卷积得到的特征图x分为三部分,分别是Q、K和Temp;由卷积网络部分得到特征图x,其中首先被转换成两个特征空间,分别是Q和K来计算注意力,其中Q(x)=W
q
x,K(x)=W
k
x;其中s
ij
=Q(x
i
)
T
K(x
j
),(1)其中,β
j,i
表示在生成j这一块的时候,所提出的模型对i部分给予了多大的关注值;C作为前面输入的x的通道数,N表示前面所输入的特征图x中所包含的像素点的个数;最后输出是其中:在上述的公式中:分别从通道域和空间域两个不同的方向考虑,重新定义了W
K
、W
Q
、W
T
和W
V
的不同规格即权重矩阵的大小不同,其中的不同规格即权重矩阵的大小不同,其中它们都被实现为1*1的卷积;最后的输出由下列公式进行计算:y
i
=γo
i
+x
i
,(3)其中,γ是可以学习的比例参数,在初始化时为0,可以学习的比例参数γ允许在刚开始的过程中依赖离自己近的邻居的线索,然后逐渐学习为离得远的线索分配更多的权重,整个学习过程是由容易到复杂;
(2)将谱归一化加入到鉴别器中,并且使用余弦退火算法替代传统的学习率更新策略对鉴别器进行进一步的...

【专利技术属性】
技术研发人员:曹斌雷欢柳鑫何华常玉春李耘
申请(专利权)人:大连理工大学电子科技大学深圳高等研究院
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1