【技术实现步骤摘要】
一种基于多尺度生成对抗网络的小样本高质量生成的方法
:
[0001]本专利技术属于计算机视觉领域,尤其涉及基于小规模样本数据集的高质量图像的生成方法。
技术介绍
:
[0002]随着图像处理技术和计算机水平的发展,利用高质量图像可以极大的提高应用的准确性和预测性,改变了使用传统小图像导致精确度不高的模式。高精度的成像设备采集到的图像质量越来越高,使得图像中包含大量的信息以及更多的细节。在遥感、医学等领域,高质量图像的标注数据集十分的稀缺、昂贵,故而通常会面临样本少、无资源等问题。因此得到一个可以应用在小样本领域的分类器或者识别器是非常有挑战性的工作。
[0003]近年来,随着神经网络的广泛使用,对于各种类型数据集都得到了深入的挖掘。最早对于小样本的扩充是对数据集进行随机翻转、旋转、裁剪、变形缩放、添加噪声、颜色扰动等方法。截至目前,基于小样本数据集的学习方法主要的研究思路分为三个方向,分别是基于模型微调的小样本学习,基于数据增强的小样本学习,基于迁移学习的小样本学习。在基于模型微调的小样本学习方法中,通常在大规模数据中进行预训练模型,在目标的小样本数据集上对神经网络模型的全连接层或者顶端的几层进行参数微调。但是模型微调的方法比较简单,在真实场景中目标数据集和源数据集往往并不类似,并且得到的模型比较容易在目标数据集上产生过拟合。为了解决过拟合问题,提出了基于数据增强和基于迁移学习的方法。在基于数据增强的小样本学习方法中,主要借助辅助数据或者辅助信息对原本的数据集进行扩充或者特征增强。但是传统数据增强方法在提高样本多 ...
【技术保护点】
【技术特征摘要】
1.基于多尺度生成对抗网络的小样本高质量生成的方法,其特征在于:首先,利用生成对抗网络训练图像生成模型,其中生成器是由多个卷积层构成的全卷积神经网络;其中判别器也是由多个卷积层构成的全卷积神经网络,输入图像通过多个卷积层得到的输出矩阵,矩阵中每个数据代表着原输入图像中的一个感受野,对应了图像的一片区域,判别器因此可以拉近生成图像和真实图像在各个区域上的距离实现整体分布的拟合,依据此原理实现图像的增广;然后利用多个图像生成模型构建多尺度模型,每一层尺度下都会接收不同尺寸大小的图像,从低到高依次增大;待第一层尺度训练完毕后,图像生成模型会学习到第一层尺度下图像大小的轮廓细节;将第一尺度下生成的图像放大后传入到第二层尺度,放大后的图像较之于第二层尺度下的训练数据集图像会有失真不清晰的现象,所以第二层尺度的图像生成模型就是学习传入图像放大后中缺失的细节信息;逐步增加尺度,最后得到清晰的生成图像。2.根据权利要求1所述的方法,其特征在于:步骤1:第一层尺度图像生成模型的构建步骤1.1:基于全卷积神经网络的生成器构建第一层尺度生成器的输入为符合期望值为0,标准差为1的正态分布的噪声图,卷积前噪声图在上下左右各填充5行,经过5个卷积层进行卷积,卷积核大小皆为3
×
3,步长皆为1,卷积过程中不进行填充,前4个卷积层通道数全是32,都采用批量归一化,它将对后续激活函数的输入进行归一化,使得数值更加稳定,批量归一化后将采用带泄露修正线性单元作为激活函数,控制负斜率的角度设置为0.2,使模型收敛更快;第5个卷积层通道数为3,采用双曲正切函数作为激活函数,将输出的数值范围定在
‑
1至1之间;噪声图通过5层卷积后会得到一个与其等大的生成图像,将作为第一层尺度判别器的输入和下一层尺度生成器的输入;步骤1.2:基于全卷积神经网络的判别器构建判别器的输入为真实图像或者生成图像,经过5个卷积层,卷积核大小皆为3
×
3,步长皆为1,卷积过程中不进行填充,前4个卷积层通道数全是32,都采用批量归一化,批量归一化后将采用带泄露修正线性单元作为激活函数,控制负斜率的角度设置为0.2;第5个卷积层通道数为1,不添加激活函数;图像通过5层卷积后会得到一个1维矩阵,将矩阵中所有元素的均值作为距离指标,作为后续损失函数的输入。3.根据权利要求1所述的方法,其特征在于:步骤2:多尺度模型构建步骤2.1:确定尺度N的数量原始图像数据集的分辨率大小为700
×
460;在模型中各尺度图像的输入最小尺寸不能低于32,最大尺寸不能高于256;因此通过缩放将原始数据集图像长宽按等比例缩放至256
×
168,该大小也会作为最高尺度的输入尺寸大小;在模型中各尺度之间的缩放因子r定为0.75;通过缩放因子r从高到低计算出各尺度的图像输入大小256
×
168,192
×
126,144
×
95,108
×
72,81
×
54,61
×
41,继续向下最小尺寸会低于32,共有6层尺度,所以尺度N设置为6;步骤2.2:除第一层尺度外,其余尺度图像生成模型构建第二层包括第二层以上的尺度都需要接收来自上一尺度的生成图像;第n层尺度的生
成器的输入为符合标准正态分布的噪声图Z
n
和来自n
‑
1层尺度生成器生成的图像F
n
‑1;在输入网络前先通过1/r乘上F
n
‑1对图像进行放大,得到放大的生成图像F
n
‑
1r
;将F
n
‑
1r
和Z
n
分别在上下左右各填充5行,相加后输入到5层卷积网络中,其中5个卷积层的卷积核大小皆为3
×
3,步长皆为1,卷积过程中不进行填充;前4个卷积层通道数全是32x(pow(2,n//4)),其中“//”是一个算术运算符,表示整数除法,它可以返回商向下取整的整数部分,pow函数用于进行求幂运算2...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。