一种图像数据增广方法技术

技术编号:38684428 阅读:7 留言:0更新日期:2023-09-02 22:57
本发明专利技术属于图像数据处理技术领域,尤其涉及一种图像数据增广方法,包括首先采集标准场景下的图像,并按照预设的场景标签进行标注,生成训练数据集以及获取目标数据;然后根据训练数据集训练构建生成对抗网络;最后将目标数据、预设的场景标签取值范围以及训练数据集中图像对应的场景标签个数输入至生成对抗网络中,并预设采样范围和预设采样个数输入至生成对抗网络,输出增广后的图像数据;所述生成对抗网络包括生成器、判别器、场景映射网络以及场景编码器。本发明专利技术能够解决现有技术中的针对采集的训练数据进行的图像增广方法存在未考虑场景的不均衡,导致在部分场景下深度学习模型的精度降低的问题。型的精度降低的问题。型的精度降低的问题。

【技术实现步骤摘要】
一种图像数据增广方法


[0001]本专利技术属于图像数据处理
,尤其涉及一种图像数据增广方法。

技术介绍

[0002]随着人工智能的发展,深度学习模型已成为研究的热门;深度学习模型广泛应用于语音识别和图像识别等领域中,尤其是在图像识别领域中,深度学习模型由多级提取抽象特征的学习处理层构成,利用深度神经网络和传播算法学习、处理和分析图像特征,以达到识别各种不同模式的目标和对象。
[0003]深度学习网络为了获得更好的泛化能力,需要大量高质量的多样化测试数据,在实际收集大量测试数据时,尤其是不同场景下的数据,往往存在较大的困难,一方面是数据存在不足,采集成本高,另一方面是数据质量较差,传统的数据处理方式包括旋转、翻转、裁剪以及集成到训练框架中进行处理,但传统的处理方式仍然不能获得大量高质量的数据,为此,现有技术中的图像数据增广方法,假定图像噪声服从正态分布,通过生成器利用三个层级的特征图像,分别为特征图、先验约束和约束特征向量,并进行通道拼接,先验约束采用正态分布的随机噪声,但实际上噪声的分布往往是高斯分布和泊松噪声等多种噪声的融合,因此数据集只限于已标定的,生成的数据存在场景不均衡的问题。

技术实现思路

[0004]本专利技术所解决的技术问题在于提供一种图像数据增广方法,以解决现有技术中的针对采集的训练数据进行的图像增广方法存在未考虑场景的不均衡,导致在部分场景下深度学习模型的精度降低的问题。
[0005]本专利技术提供的基础方案:一种图像数据增广方法,包括:
[0006]S1:采集标准场景下的图像,并按照预设的场景标签进行标注,生成训练数据集一,并获取用于目标检测的目标数据;
[0007]S2:基于训练数据集一,训练建立多场景融合参数融合的生成对抗网络;所述生成对抗网络包括生成器、判别器、场景映射网络以及场景编码器;
[0008]S3:将目标数据、预设的场景标签取值范围以及目标数据中图像对应的场景标签个数输入至生成对抗网络中,并预设采样范围和预设采样个数输入至生成对抗网络,输出增广后的图像数据。
[0009]进一步,所述S1中预设的场景标签包括色温参数、亮度参数和运动模糊度参数。
[0010]进一步,所述S2中包括:
[0011]S2

1:将色温参数、亮度参数取对数后,和运动模糊度参数按照预设采样范围和预设采样个数经采样后组成掩码向量,并和图像一同输入映射网络中映射出风格码;
[0012]S2

2:通过场景编码器从映射网络中提取风格码。
[0013]进一步,所述S3包括:
[0014]S3

1:将风格码和目标数据中的图像通过生成器得到输出图像;
[0015]S3

2:采用判别器,通过损失函数计算生成器的损失值,根据损失值调整对应的网络参数,直至得到收敛的生成对抗网络。
[0016]进一步,所述S3

2中的损失函数包括对抗损失和风格多样损失,所述对抗损失的计算方式如下:
[0017][0018]其中,x表示图像,m表示掩码向量;
[0019]所述风格多样损失计算公式如下:
[0020][0021]其中,
[0022]进一步,目标数据中的图像数据尺寸与生成器的输入尺寸一致。
[0023]本专利技术的原理及优点在于:本专利技术在采集图像数据时,根据标准场景下的图像标签对采集的图像进行标注,同时设定生成对抗网络,改进生成对抗网络的输入参数,包括采样的标签、采样的范围和采样的个数,通过风格码的生成和标记,生成的图像数据一是能够限定标准场景范围,二是不仅限于预采集的少量场景,从而生成的图像更符合成像系统实际采集的图像,也就能更好的提高深度学习模型在实际场景中的性能,尤其是训练数据集中未包含场景的性能。
附图说明
[0024]图1为本专利技术实施例的流程图。
具体实施方式
[0025]下面通过具体实施方式进一步详细说明:
[0026]在深度学习网络成功应用的前提,为具有大规模的数据集,而图像增广技术是通过对训练图像做一系列的随机改变,来产生相似但又不同的训练样本,从而扩大训练数据集的规模;此外,图像增广还通过随机改变训练样本来降低网络模型对某些属性的依赖,从而提高模型的泛化能力;为此,现有的图像增广方式,采用假定图像噪声服从正态分布,通过生成器进行处理,存在生成的数据集场景不均衡的问题。
[0027]为此,本申请提出一种图像数据增广方法,实施例基本如附图1所示:包括:
[0028]S1:采集标准场景下的图像,并按照预设的场景标签进行标注,生成训练数据集,并获取用于目标检测的目标数据;
[0029]在S1中,通过采集标准场景下的不同色温、亮度和运动模糊度的图像数据,并进行色温、亮度和运动模糊度的标注,生成训练数据集,其中,色温和亮度通过仪器测得,运动模糊度根据图像数据中运动物体的模糊程度得到,具体为在[0,1范围内取浮点值;标准场景下的采集是为训练生成对抗网络,其是本案中增广方法的基础,这三个标签是对图像有影响的主要属性,但不限于这三个标签,还有其他如对比度等属性。
[0030]用于目标检测的目标数据为进行实际增广的数据,例如针对汽车车牌的识别时,需要进行数据增广的车牌图像即为目标数据。
[0031]S2:基于训练数据集一,训练建立多场景融合参数融合的生成对抗网络;所述生成对抗网络包括生成器、判别器、场景映射网络以及场景编码器;
[0032]预设的场景标签的取值范围具体为,标准场景下的色温为T,亮度为L,运动模糊度为B,因此色温的取值范围为[T1,T2],亮度的取值范围为[L1,L2],运动模糊度的取值范围为[B1,B2];
[0033]训练数据集中图像数据对应的场景标签的个数具体为:在训练数据集中的每张图片数据,所有生成的对应色温的个数为J,所要生成的对应亮度为K,所要生成的对应运动模糊度个数为L。
[0034]将上述的具体数据输入到生成对抗网络中,在生成对抗网络中包括了生成器、判别器、场景映射网络以及场景编码器,其中,场景映射网络的作用在于生成风格码,具体为,将色温参数和亮度参数取对数后和运动模糊度一起,按照预设的采样范围和预设的采样个数进行采样,并组成掩码向量,场景映射网络还将掩码向量和图像一起映射成风格码,在本实施例中,风格码表示标准场景下的图像风格,例如根据一个人的性别设置图像风格,在这种情况下,风格就表示化妆、体表特征和发型等,通过生成的风格码,只需要采集少量的图像数据,通过生成对抗网络进行迁移,就能够得到更多的场景图像和均匀的场景图像。
[0035]掩码向量可表示为m=[lgT,lgL,B],在具体实施过程中,场景映射网络由多层感知器组成。
[0036]因此,在S2中,还包括:
[0037]S2

1:将色温参数、亮度参数取对数后,和运动模糊度参数按照预设采样范围和预设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像数据增广方法,其特征在于:包括:S1:采集标准场景下的图像,并按照预设的场景标签进行标注,生成训练数据集一,并获取用于目标检测的目标数据;S2:基于训练数据集一,训练建立多场景融合参数融合的生成对抗网络;所述生成对抗网络包括生成器、判别器、场景映射网络以及场景编码器;S3:将目标数据、预设的场景标签取值范围以及目标数据中图像对应的场景标签个数输入至生成对抗网络中,并预设采样范围和预设采样个数输入至生成对抗网络,输出增广后的图像数据。2.根据权利要求1所述的一种图像数据增广方法,其特征在于:所述S1中预设的场景标签包括色温参数、亮度参数和运动模糊度参数。3.根据权利要求2所述的一种图像数据增广方法,其特征在于:所述S2中包括:S2

1:将色温参数、亮度参数取对数后,和运动模糊度参数按照预设采样范围和预设采样个数经采样后组成掩码向...

【专利技术属性】
技术研发人员:张大飞
申请(专利权)人:重庆锐明信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1