【技术实现步骤摘要】
一种基于生成对抗网络的样本数据增强方法
[0001]本专利技术涉及计算机图像处理
,具体涉及在面对小样本目标检测的情况下,利用生成对抗网络学习已有数据集的特征,生成高质量的图像来实现有效的图像数据增强。
技术介绍
[0002]数据增强是目前扩充数据集规模的重要方法,能够丰富数据集的同时也能够提高相应分类检测模型的性能。数据增强如果根据处理数据集的时间可以划分为离线增强和在线增强。离线增强是在网络模型加载训练数据之前对数据集进行相应的处理,适用于图片数量较少的数据集;在线增强是网络模型加载训练数据之后,网络利用本身自带的增强算法对数据集进行实时增强,这种方法适用于较大型的数据集。目前主流的深度学习框架均有自己的在线增强策略。
[0003]如果按照数据增强的方式来划分,可分为有监督数据增强和无监督数据增强。有监督数据增强也可以细分为单样本增强和多样本增强。有监督数据增强常见于传统的数据增强,对单样本而言主要增强方式包括几何变换(旋转、翻转、裁剪、缩放变形和仿射等)和颜色变换(噪声、颜色变换、模糊、随机擦除和超像素法等),这些方法都是围绕样本本身进行的操作,过多地使用这类方法会导致数据集缺乏多样性,产生大量无使用价值的数据样本,反而更容易使网络模型出现过拟合。
技术实现思路
[0004]有鉴于此,本专利技术提出一种基于生成对抗网络的样本数据增强方法,该方法运用生成对抗网络,实现对小样本目标识别的图像增强方法。
[0005]为了实现上述目的,本专利技术采用的技术方案为:
[000
【技术保护点】
【技术特征摘要】
1.一种基于生成对抗网络的样本数据增强方法,其特征在于,包括以下步骤:(1)根据DOTA数据集的标注信息,裁剪数据集图像中包含的目标,制作不含背景信息的真实目标图像数据集R
‑
Dataset1,目标分为飞机、船舶、小型交通工具三类;(2)使用最小二乘损失函数替换深度卷积生成对抗网络DCGAN中的原始损失函数,得到最小二乘深度卷积神经网络L
‑
DCGAN,用R
‑
Dataset1训练L
‑
DCGAN,用训练好的L
‑
DCGAN网络生成不含背景信息的生成样本数据集G
‑
Dataset1;(3)采用余弦感知哈希相似度匹配方法进行相似度匹配,对于G
‑
Dataset1中的每张图片,在R
‑
Dataset1中寻找与之匹配度最高的图片,此时R
‑
Dataset1中的部分图像可能未被作为G
‑
Dataset1中任何图像的匹配度最高的图像,也有部分图像可能被作为G
‑
Dataset1中多张图像的匹配度最高的图像;(4)根据步骤(3)获得的匹配结果,在DOTA数据集的原始大图上,用G
‑
Dataset1中的生成的目标图像直接同尺寸覆盖掉与它相似度最高的真实样本,并记录下覆盖位置信息;此时,部分原始大图上的同一个目标可能被覆盖多次,这种情况下,第k幅原始大图将被复制n
k
份,n
k
表示第k幅原始大图中,所有目标需要被覆盖的次数中最多的次数,单个目标的覆盖次数小于n
k
的,随机选择多出数量的原始大图,不进行覆盖,n
k
个原始大图中,不同的目标之间没有对应关系,均独立进...
【专利技术属性】
技术研发人员:张俊凯,耿虎军,张玉鹏,杜明,
申请(专利权)人:中国电子科技集团公司第五十四研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。