改进WGAN的图像生成方法技术

技术编号:39128529 阅读:26 留言:0更新日期:2023-10-23 14:49
本发明专利技术属于计算机视觉技术领域,公开了一种改进WGAN的图像生成方法,所述方法包括:图像预处理,将数据集中的真实图像进行等比例压缩处理;构建改进WGAN模型,所述模型包括一个生成器和一个判别器;在生成器和判别器的部分网络层中设置残差模块;将随机噪声输入至生成器,通过生成器的各层逐渐将特征图的尺寸增加,同时对图像特征进行处理和修正;将生成器的输出结果与预处理后的图像输入至判别器以判断图像的真实性;基于改进WGAN模型获取生成图像。本发明专利技术通过设计一个嵌入谱范数归一化的残差模块以替代判别器和生成器的部分网络层,并在生成器的中间层引入了自注意力机制,以缓和训练过程中出现的梯度消失问题以及生成图像质量不高、多样性不足问题。多样性不足问题。多样性不足问题。

【技术实现步骤摘要】
改进WGAN的图像生成方法


[0001]本专利技术属于计算机视觉
,特别涉及一种改进WGAN的图像生成方法。

技术介绍

[0002]目前结合深度学习任务的实现都需要较大的数据集做训练支撑,而数据集的采集工作量大,耗时长,还需要专业的设备进行操作,所以具有局限性。因此采用生成对抗式网络(GAN)来生成数据样本。一般来说,生成对抗网络由生成器和判别器组成,生成器接收一个随机噪声向量作为输入,并生成尽可能逼真的合成数据样本;判别器则是一个二元分类器,目标是将生成器生成的样本与真实样本区分开来。通过对抗训练,生成器努力欺骗判别器,使其无法准确辨别合成数据和真实数据,而判别器通过学习真实和合成数据的特征来提高自己的准确性,这种对抗性过程促使生成器生成更真实的样本。
[0003]W GAN是一种改进的GAN框架,其引入了Wasserstein距离作为GAN的损失函数,通过衡量真实和生成样本分布之间的距离来优化生成器和判别器。其生成器包括全连接层和反卷积层,而判别器包括卷积层和全连接层。
[0004]然而在生成图像的过程中,采用常用的生本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种改进WGAN的图像生成方法,其特征在于,所述方法包括:图像预处理,将数据集中的真实图像进行等比例压缩处理;构建改进WGAN模型,所述模型包括一个生成器和一个判别器;在生成器和判别器的部分网络层中设置残差模块;将随机噪声输入至生成器,通过生成器的各层逐渐将特征图的尺寸增加,同时对图像特征进行处理和修正;将生成器的输出结果与预处理后的图像输入至判别器以判断图像的真实性;基于改进WGAN模型获取生成图像。2.根据权利要求1所述改进WGAN的图像生成方法,其特征在于,在所述生成器的中间层嵌入自注意力机制。3.根据权利要求1所述改进WGAN的图像生成方法,其特征在于,所述生成器包括一个全连接层和五个特征提取层;第一个特征提取层包括两个残差模块、两个上采样层;第二个特征提取层至第四个特征提取层均包括一个残差模块、一个上采样层以及一个自注意力模块;第五个特征提取层包括一个残差模块、一个批量归一化层、一个LeakyReLU激活函数、一个卷积核、一个Tanh激活函数;所述判别器包括一个卷积层、四个特征提取层、一个批量归一化层和ReLU激活函数、一个全连接层;其中,判别器模块中的最上层特征提取层包括两个残差模块和一个平均池化层;其余特征提取层均包括一个残差模块和一个平均池化层。4.根据权利要求3所...

【专利技术属性】
技术研发人员:吴佳乐
申请(专利权)人:江西理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1