一种基于合成注意力机制的生成对抗网络制造技术

技术编号：34462373 阅读：49 留言：0更新日期：2022-08-10 08:32

本发明专利技术公开一种基于合成注意力机制的生成对抗网络，属于深度学习领域。本发明专利技术舍弃了自注意力机制计算注意力矩阵的过程，而是根据输入数据合成注意力矩阵，减少了网络训练时间。在CelebA数据集进行的实验中，结果表明与基于自注意力机制的生成对抗网络相比，基于合成注意力机制的生成对抗网络模型生成性能评估指标FID值由29.11降至26.4，且其FID值随着训练次数增加而下降。这些结果表明，合成注意力机制有提高训练过程稳定性的能力，减少生成器发生模式坍缩现象的能力。从而提高生成模型学习真实数据特征分布的能力，得到生成能力更强的生成器，主要体现在生成样本的多样性。针对合成注意力机制的上述功能，可用于提高生成对抗网络的生成能力。对抗网络的生成能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于合成注意力机制的生成对抗网络

[0001]本专利技术属于深度学习领域，具体涉及合成注意力机制在生成对抗网络中的应用。

技术介绍

[0002]生成对抗网络(GAN)最早出现在Ian Goodfellow的文章《Generative Adversarial Networks》中，该文章首次提出“生成器
‑
判别器”进行对抗训的方式。即生成器用来生成假样本，判别器用来判定样本的真假，通过交替训练，最终达到生成器生成的样本具有以假乱真的能力。研究生成对抗网络的意义不仅仅在于获得具有以假乱真能力的生成器，更重要的是说明我们掌握了一种概率模型和推断方法。
[0003]早期的GAN面临一系列问题，如模型架构，训练过程的稳定性、收敛性、梯度消失，生成器的模式坍缩。DCGAN(Deep Convolution GAN)的出现为解决这一系列问题奠定了基础，DCGAN提出一种生成器和判别器的架构，这两个架构能极大地稳定GAN的训练。PGGAN(Progressive Growing GAN)提出了一种渐进地训练策略使得生成器可以生成分辨率更大的高清图片。WGAN(Wasserstein GAN)通过提出权值裁剪避免了GAN的梯度消失问题，在WGAN的基础上提出来的WGAN
‑
GP提出梯度惩罚来代替权值裁剪，实现了比WGAN训练更稳定，生成的图像质量更高的目的。SAGAN(Self
‑
Attention GAN)通过将自然语言处理领域的注意力机制引入生成对抗网络，从而解决了...

【技术保护点】

【技术特征摘要】
1.一种基于合成注意力机制的生成对抗网络，其特征在于，包括以下步骤：S1、对生成器(Generator)和判别器(Discriminator)的权重使用谱归一化(Spectral Normalization)以提高训练过程的稳定性；S2、对生成器和判别器都使用合成注意力层来捕获数据的长距离特征。2.根据权利要求1所述的合成注意力机制的生成对抗网络，其特征在于，所述步骤S1中对生成器和判别器使用谱归一化的具体方法为：S1
‑
1：使用正态分布初始化列向量S1
‑
2：使用未归一化权值矩阵W∈R
h
×
w
更新列向量更新列向量更新列向量S1
‑
3：使用更新后的列向量计算矩阵谱范数σ(W)：S1
‑
4：使用矩阵谱范数对未归一化矩阵进行谱归一化：3.根据权利要求1所述的合成注意力机制的生成对抗网络，其特征在于，所述步骤S2中对生成器和判别器使用合成注意力层的具体方法为：S2
‑
1：输入数x∈R
C
×
N
与W
f
∈R
a
×
C
叉乘获得F
a
∈R
a
×
N
，F
a
＝W
f
x；S2
‑
2：输入数x∈R
C
×
N
与W
g
∈R
b
×
C
叉乘获得F
b
∈R
...

【专利技术属性】
技术研发人员：袁震，徐蔚鸿，
申请(专利权)人：长沙理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人