一种基于多尺度生成对抗网络的小样本高质量生成的方法技术

技术编号:35992176 阅读:25 留言:0更新日期:2022-12-17 23:07
一种基于多尺度生成对抗网络的小样本高质量生成的方法属于计算机视觉领域,研究了一种针对可以在小样本数据集上生成高分辨率图像的方法。首先利用基于全卷积神经网络构建的生成器,得到生成图像。然后利用基于全卷积神经网络构建的判别器,在隐式上对于图像进行增广,分别对生成图片和真实图像计算距离指标。生成器和判别器组成单层尺度下的图像生成模型。利用图像生成模型构建多层尺度结构,从低到高处理图像的尺寸逐步增大。最后逐层进行动态博弈实现生成图像分布向真实图像分布拟合。本发明专利技术解决了小样本的数据集少和生成图像清晰度不够的问题。晰度不够的问题。晰度不够的问题。

【技术实现步骤摘要】
一种基于多尺度生成对抗网络的小样本高质量生成的方法


[0001]本专利技术属于计算机视觉领域,尤其涉及基于小规模样本数据集的高质量图像的生成方法。

技术介绍

[0002]随着图像处理技术和计算机水平的发展,利用高质量图像可以极大的提高应用的准确性和预测性,改变了使用传统小图像导致精确度不高的模式。高精度的成像设备采集到的图像质量越来越高,使得图像中包含大量的信息以及更多的细节。在遥感、医学等领域,高质量图像的标注数据集十分的稀缺、昂贵,故而通常会面临样本少、无资源等问题。因此得到一个可以应用在小样本领域的分类器或者识别器是非常有挑战性的工作。
[0003]近年来,随着神经网络的广泛使用,对于各种类型数据集都得到了深入的挖掘。最早对于小样本的扩充是对数据集进行随机翻转、旋转、裁剪、变形缩放、添加噪声、颜色扰动等方法。截至目前,基于小样本数据集的学习方法主要的研究思路分为三个方向,分别是基于模型微调的小样本学习,基于数据增强的小样本学习,基于迁移学习的小样本学习。在基于模型微调的小样本学习方法中,通常在大规模数据中进行预训练模型,在目标的小样本数据集上对神经网络模型的全连接层或者顶端的几层进行参数微调。但是模型微调的方法比较简单,在真实场景中目标数据集和源数据集往往并不类似,并且得到的模型比较容易在目标数据集上产生过拟合。为了解决过拟合问题,提出了基于数据增强和基于迁移学习的方法。在基于数据增强的小样本学习方法中,主要借助辅助数据或者辅助信息对原本的数据集进行扩充或者特征增强。但是传统数据增强方法在提高样本多样性上具有一定的限制。在基于迁移学习的小样本学习中,是指利用旧知识来学习新知识来将已学会的知识很快的迁移到新的领域中。但是迁移学习方法的准确度过度依赖源领域和目标领域之间的关联性。
[0004]考虑到遥感、医学等小样本领域面临的三个挑战:数据量较少、算法跨中心泛化能力差和准确度要求较高,本专利技术提出一种基于多尺度生成对抗网络的小样本高质量生成方法。首先构建基于生成对抗网络(Generative Adversarial Networks,GAN)的图像生成模型。然后利用图像生成模型构建多层尺度的模型,利用不同大小的图像作为输入,在不同尺度下进行生成对抗,学习不同尺度下图像的分布。最后得到清晰的生成图像,实现小样本的高质量生成。

技术实现思路

[0005]本专利技术提出一种基于多尺度生成对抗网络的小样本高质量生成方法,使用多个生成对抗网络结构分别学习了不同大小图像中图像块(Patch)的分布,将每个图像块看作成一个图像,因此可以利用小样本数据集从粗糙到细致、从低分辨率到高分辨率逐步生成真实图像。
[0006]本专利技术的基于多尺度生成对抗网络的小样本生成方法,首先,利用生成对抗网络
训练图像生成模型,其中生成器是由多个卷积层构成的全卷积神经网络(Convolutional Neural Network,CNN),全卷积网络较之于传统带有全连接网络的训练更加高效,避免了由于使用像素块带来的重复存储和计算卷积的问题;其中判别器也是由多个卷积层构成的全卷积神经网络也可称马尔可夫判别器,输入图像通过多个卷积层得到的输出矩阵中每个数据代表着原输入图像中的一个感受野,对应了图像的一片区域,判别器因此可以拉近生成图像和真实图像在各个区域上的距离实现整体分布的拟合,依据此原理实现图像的增广。然后利用图像生成模型构建多尺度模型,每一层尺度下都会接收不同尺寸大小的图像,从低到高依次增大。待第一层尺度训练完毕后,图像生成模型会学习到第一层尺度下图像大小的轮廓细节。将第一尺度下生成的图像放大后传入到第二层尺度,放大后的图像较之于第二层尺度下的训练数据集图像会有失真不清晰的现象,所以第二层尺度的图像生成模型就是学习传入图像放大后中缺失的细节信息。逐步增加尺度,最后得到清晰的生成图像。本方法主要过程如附图1所示,可分为三个步骤:图像生成模型构建、多尺度模型构建、逐层生成图像。
[0007](1)图像生成模型构建
[0008]图像生成模型由生成器、判别器组成。各层生成器的输入包括两个部分,一个是当前层的随机噪声,一个是来自上一层的放大图像,利用残差思想,将放大后的输入图像不仅作为输入,也会和网络输出相加作为最终的输出,让生成器仅仅去学习缺失的细节,间接的降低生成器的学习难度。由全卷积神经网络组成的马尔可夫判别器,采用该结构进行训练,既拓展了样本数量,又保留了各个样本之间的关联性。
[0009](2)多尺度模型构建
[0010]每一层都是由单独的一个图像生成模型组成,第一层尺度生成的图像大小与缩小一定倍数的原图相同,小图像中无法获得太多细节,所以在第二层尺度中生成的图像较之第一尺度要大,直到达到所需的大小。
[0011](3)逐层生成图像
[0012]除了第一层尺度的图像生成模型是学习生成完整图像,其余尺度的图像生成模型都是学习填补来自上一尺度放大后的生成图像丢失的细节。逐步生成图像使多尺度模型可以生成较大的高质量图像。
[0013]本专利技术与现有技术相比,具有以下明显的优势和有益效果:
[0014]1、使用全卷积神经网络构建的生成器可以处理任意尺寸大小的图像,不需要为每一层尺度单独设计模型。基于全卷积神经网络构建判别器,采用该结构进行训练,在原理上既拓展了样本数量,又保留了各个样本之间的关联性。
[0015]2、构建的多尺度结构,在每一层尺度上只是学习由上一尺度传来图像放大后缺失的细节信息,层层递进给生成高分辨率图像创造了可行性。
[0016]实验证实,利用多尺度生成对抗网络进行训练,可以在BreakHis数据库上实现38.41593的FID(Fr
é
chet Inception Distance),该指标表示生成图像的多样性和质量,FID越小,则图像多样性越好,质量越好。因此,该方法在小样本数据集任务中,有着重要的应用价值。
附图说明:
[0017]图1为本专利技术所涉及方法的流程图;
[0018]图2为第一层尺度下生成器结构图;
[0019]图3为第一层尺度下判别器结构图;
[0020]图4单尺度下图像生成模型网络结构图;
[0021]图5为多尺度生成对抗网络网络结构图;
[0022]图6最终生成图像示例;
具体实施方式:
[0023]以下结合具体实施例,并参照附图,数据集从BreakHis数据库中进行选取,对本专利技术进一步详细说明。
[0024]步骤1:第一层尺度图像生成模型的构建
[0025]步骤1.1:基于全卷积神经网络的生成器构建
[0026]本专利技术提出的基于多尺度生成对抗网络的小样本高质量生成的方法基于当前主流深度学习框架PyTorch实现,本步骤中生成器具体结构图见附图2。第一层尺度生成器的输入为符合期望值为0,标准差为1的正态分布的噪声图,卷积前噪声图在上下左右各填充(padding)5行,经过5个卷积层进行卷积,卷积核大小皆为3
×<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于多尺度生成对抗网络的小样本高质量生成的方法,其特征在于:首先,利用生成对抗网络训练图像生成模型,其中生成器是由多个卷积层构成的全卷积神经网络;其中判别器也是由多个卷积层构成的全卷积神经网络,输入图像通过多个卷积层得到的输出矩阵,矩阵中每个数据代表着原输入图像中的一个感受野,对应了图像的一片区域,判别器因此可以拉近生成图像和真实图像在各个区域上的距离实现整体分布的拟合,依据此原理实现图像的增广;然后利用多个图像生成模型构建多尺度模型,每一层尺度下都会接收不同尺寸大小的图像,从低到高依次增大;待第一层尺度训练完毕后,图像生成模型会学习到第一层尺度下图像大小的轮廓细节;将第一尺度下生成的图像放大后传入到第二层尺度,放大后的图像较之于第二层尺度下的训练数据集图像会有失真不清晰的现象,所以第二层尺度的图像生成模型就是学习传入图像放大后中缺失的细节信息;逐步增加尺度,最后得到清晰的生成图像。2.根据权利要求1所述的方法,其特征在于:步骤1:第一层尺度图像生成模型的构建步骤1.1:基于全卷积神经网络的生成器构建第一层尺度生成器的输入为符合期望值为0,标准差为1的正态分布的噪声图,卷积前噪声图在上下左右各填充5行,经过5个卷积层进行卷积,卷积核大小皆为3
×
3,步长皆为1,卷积过程中不进行填充,前4个卷积层通道数全是32,都采用批量归一化,它将对后续激活函数的输入进行归一化,使得数值更加稳定,批量归一化后将采用带泄露修正线性单元作为激活函数,控制负斜率的角度设置为0.2,使模型收敛更快;第5个卷积层通道数为3,采用双曲正切函数作为激活函数,将输出的数值范围定在

1至1之间;噪声图通过5层卷积后会得到一个与其等大的生成图像,将作为第一层尺度判别器的输入和下一层尺度生成器的输入;步骤1.2:基于全卷积神经网络的判别器构建判别器的输入为真实图像或者生成图像,经过5个卷积层,卷积核大小皆为3
×
3,步长皆为1,卷积过程中不进行填充,前4个卷积层通道数全是32,都采用批量归一化,批量归一化后将采用带泄露修正线性单元作为激活函数,控制负斜率的角度设置为0.2;第5个卷积层通道数为1,不添加激活函数;图像通过5层卷积后会得到一个1维矩阵,将矩阵中所有元素的均值作为距离指标,作为后续损失函数的输入。3.根据权利要求1所述的方法,其特征在于:步骤2:多尺度模型构建步骤2.1:确定尺度N的数量原始图像数据集的分辨率大小为700
×
460;在模型中各尺度图像的输入最小尺寸不能低于32,最大尺寸不能高于256;因此通过缩放将原始数据集图像长宽按等比例缩放至256
×
168,该大小也会作为最高尺度的输入尺寸大小;在模型中各尺度之间的缩放因子r定为0.75;通过缩放因子r从高到低计算出各尺度的图像输入大小256
×
168,192
×
126,144
×
95,108
×
72,81
×
54,61
×
41,继续向下最小尺寸会低于32,共有6层尺度,所以尺度N设置为6;步骤2.2:除第一层尺度外,其余尺度图像生成模型构建第二层包括第二层以上的尺度都需要接收来自上一尺度的生成图像;第n层尺度的生
成器的输入为符合标准正态分布的噪声图Z
n
和来自n

1层尺度生成器生成的图像F
n
‑1;在输入网络前先通过1/r乘上F
n
‑1对图像进行放大,得到放大的生成图像F
n

1r
;将F
n

1r
和Z
n
分别在上下左右各填充5行,相加后输入到5层卷积网络中,其中5个卷积层的卷积核大小皆为3
×
3,步长皆为1,卷积过程中不进行填充;前4个卷积层通道数全是32x(pow(2,n//4)),其中“//”是一个算术运算符,表示整数除法,它可以返回商向下取整的整数部分,pow函数用于进行求幂运算2...

【专利技术属性】
技术研发人员:刘博陈铭明王慧娜
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1