一种多尺度纹理随机化的数据增强方法技术

技术编号:26379754 阅读:35 留言:0更新日期:2020-11-19 23:48
本发明专利技术公开一种多尺度纹理随机化的数据增强方法,本方法将随机4个训练样本拼接形成一个输出样本,输出样本保留了4个训练样本的特征,可以增加样本特征,防止训练时的过拟合;随机增加纹理掩码框,比较纹理掩码框与样本标记框自检的重叠区域,如果重叠区域小于设定阈值,则保留该掩码框,样本标记框为重叠区域标记框的话,则实现了重叠区域的处理。本发明专利技术通过对训练样本进行多尺度纹理随机化的数据增强,可以提高目标检测任务训练数据预处理的效果,提高识别检测效果。

【技术实现步骤摘要】
一种多尺度纹理随机化的数据增强方法
本专利技术涉及人工智能领域,尤其涉及计算机视觉典型目标检测任务训练数据预处理阶段,具体地说,是一种多尺度纹理随机化的数据增强方法。
技术介绍
在现实的应用场景中,往往会大量存在遮挡问题。在目标检测任务的训练样本当中,就存在大量标记目标重叠的情况,这就会导致被遮挡的目标,在训练过程中存在部分其他目标的特征,从而影响其识别检测效果。论文《ImprovedRegularizationofConvolutionalNeuralNetworkswithCutout》(https://arxiv.org/abs/1708.04552)中提出了一种数据增强的方法,在图像上进行随机位置和一定大小的区域进行裁剪。该方法是在尽可能的在训练中添加遮挡的样本,却无法很好处理训练样本中自身存在大量遮挡样本的情况。论文《mixup:BeyondEmpiricalRiskMinimizatio》(https://arxiv.org/abs/1710.09412)中提出了一种数据增强的方法,随机挑选两张图片进行叠加。在目标检本文档来自技高网...

【技术保护点】
1.一种多尺度纹理随机化的数据增强方法,其特征在于:包括以下步骤:/nS01)、选取N个训练样本P={P

【技术特征摘要】
1.一种多尺度纹理随机化的数据增强方法,其特征在于:包括以下步骤:
S01)、选取N个训练样本P={P0,P1,…,Pn-1}以及与N个训练样本相对应的标记框信息T={[X0,Y0,W0,H0,L0],[X1,Y1,W1,H1,L1],…,[Xn-1,Yn-1,Wn-1,Hn-1,Ln-1]};
其中P包含图像信息,如P0包含(img0,img_w0,img_h0),img0表示图像P0,img_w0表示图像P0的宽,img_h0表示图像P0的高,P1、…、Pn-1与之相同;
T包含图像的标记信息,[X,Y,W,H,C]表示为一组标记框信息,分别代表标记框的左上角点(X,Y),W是宽,H是高,L是该框的类别;
S02)、随机从训练样本集中挑选4个样本及4个样本对应的标记框信息,4个样本记为Ptl、Ptr、Pbl、Pbr,4个样本对应的标记框信息记为[Xtl,Ytl,Wtl,Htl,Ltl],[Xtr,Ytr,Wtr,Htr,Ltr],[Xbl,Ybl,Wbl,Hbl,Lbl],[Xbr,Ybr,Wbr,Hbr,Lbr];
S03)、随机生成4个尺度缩放因子,即生成S=[s0,s1,s2,s3],其中s的范围在[0.5,1.0]之间;
S04)、设数据增强后的样本为Pout,设置Pout的图像信息为(img,img_w,img_h),其中img表示数据增强后的图像Pout,img_w表示图像Pout的宽度,img_h表示图像Pout的高度;
S05)、设数据增强后的样本Pout中心点坐标为(xc,yc),则
xc=img_w/2+b(1),
yc=img_h/2+b(2),
其中b∈[-(img_w+img_h)/16,(img_w+img_h)/16];
S06)、当输入样本为Ptl时,图像imgtl乘以尺度缩放因子s0,改变其图像尺度,输出图像记为Ptl0,同理另外三个输入样本,经过尺度缩放得到输出图像记为Ptr1、Pbl2、Pbr3,输出样本Pout为Ptl0、Ptr1、Pbl2、Pbr3不同尺度的拼接,并且将对应的标记框信息进行变换,记为Tout;
S07)、随机生成n个不同大小、不同形状、不同颜色的纹理掩码框,记为Mask=[m0,m1,…,mn-1];
S08)、计算每个生成的掩码框与输出样本标记框的重叠区域,重叠区域记为Overlap=[o0,o1,…,on-1];
S09)、假设随机生成掩码框mi与输出样本中某个标记框tj重叠,重叠区域的面积为areai,则oi=areai/(wj*hj),其中标记框tj的位置信息为[xj,yj,wj,hj];
S10)、当重叠区域的值oi大于阈值ost,则删除该掩码...

【专利技术属性】
技术研发人员:井焜陈英鹏许野平刘辰飞
申请(专利权)人:神思电子技术股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1