一种基于目标重叠度计算和自适应调整的数据增强方法技术

技术编号：33274301 阅读：39 留言：0更新日期：2022-04-30 23:32

本发明专利技术提供了一种基于目标重叠度计算和自适应调整的数据增强方法，包括：S1、将已标注的目标检测任务的数据集作为对象；S2、对待扩展目标进行选择：选定一个或多个目标类别作为待扩展类别，筛选出整个数据集中包含所述待扩展类别的图片的集合作为待扩展集合，从整个数据集中随机选取一定比例数量的图片组成集合作为待生成集合；S3、所述待扩展集合与所述待生成集合中的图片随机组合，通过重叠度计算与自适应调整的方法，生成新图片与新标签以进行数据增强。本发明专利技术可以提升数据集中的图片数量、目标数量、目标与背景组合的多样性，提升深度神经网络模型的训练效率和性能。度神经网络模型的训练效率和性能。度神经网络模型的训练效率和性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于目标重叠度计算和自适应调整的数据增强方法

[0001]本专利技术属于图片处理数据增强
，具体涉及一种基于目标重叠度计算和自适应调整的数据增强方法。

技术介绍

[0002]目标检测任务的目的是对图像或视频中出现的物体进行识别、分类以及定位，该任务是通过对深度学习技术中的深度神经网络来构建的模型的训练来实现。在训练过程中，需要使用到已标记的数据集——即对图片中需要识别的目标完成类别和位置的标注后的数据集，因此数据集的图片数量、目标数量、背景数量、标注的准确度等等都会影响模型的训练效果。目标检测任务往往需要进行数据增强，数据增强又可称为数据扩展。在目标检测的模型进行训练前，对数据集进行数据增强处理是通过增加目标数量、增加背景的多样性、提升图片样本数量等一系列方法来提升用该数据集训练后的模型的检测能力的方法。数据增强方法是在不实质性的修改数据集中原有的图片以及标签的前提下，通过一些算法将数据集的图片数量、目标数量、背景数量等进行扩增，从而使有限的数据产生等价于更多数据的效果。
[0003]现有的数据增强方法主要有mosaic增强和mixup增强，其中mosaic增强主要是将四张图片进行随机裁剪，再拼接成一张新图片。该方法虽然提升了每张图片中的检测背景的多样性，但是一次需要用到4张图片，对数据集的图片数量、目标数量的需求较大，且无法有效、定向地解决目标在各个类别之间数量的不平衡性。因此该方法不适合于较稀疏或者各个类别目标数量不均衡的数据集。mixup增强主要是将一张图片与另一张图片的像素值按一定比例进行融...

【技术保护点】

【技术特征摘要】
1.一种基于目标重叠度计算和自适应调整的数据增强方法，其特征在于，包括：S1、将已标注的目标检测任务的数据集作为对象；S2、对待扩展目标进行选择：选定一个或多个目标类别作为待扩展类别，筛选出整个数据集中包含所述待扩展类别的图片的集合作为待扩展集合，从整个数据集中随机选取一定比例数量的图片组成集合作为待生成集合；S3、将所述待扩展集合与所述待生成集合中的图片随机组合，通过用于衡量目标内容位置重合程度的重叠度计算与自适应调整的方法，生成新图片与新标签以进行数据增强。2.根据权利要求1所述的一种基于目标重叠度计算和自适应调整的数据增强方法，其特征在于，所述目标检测任务的数据集包括原图片和标签文件，所述标签文件记录有所述原图片中各个待检测目标的类别名称和位置框的坐标值信息。3.根据权利要求2所述的一种基于目标重叠度计算和自适应调整的数据增强方法，其特征在于，通过各个所述待检测目标对应的位置框的坐标值信息，从图像样本中获取待检测目标的像素内容，对待检测目标的位置框进行修改，并直接生成修改后的位置框的坐标值信息。4.根据权利要求2所述的一种基于目标重叠度计算和自适应调整的数据增强方法，其特征在于，所述步骤S3包括：S301、随机选取所述待扩展集合中的一张待扩展图片，读取所述待扩展图片中的一个或多个类别属于所述待扩展目标的类别名称和位置框的坐标值信息；S302、根据所述待扩展目标的标签文件，通过基于重叠度计算的自适应尺寸调整改变待扩展类别的像素区域范围，将所述待扩展类别的像素区域范围作为待复制的像素区域；S303、随机选取待生成集合中的一张待生成图片，并选取所述待生成图片中的随机位置作为待粘贴的区域，通过基于重叠度计算的自适应尺寸调整来调整待粘贴的区域的范围；S304、将所述待扩展图片中得到的包含待扩展目标的像素区域粘贴进所述待粘贴的区域并替代所述待粘贴的区域内的像素内容，生成一张新图片，并同时...

【专利技术属性】
技术研发人员：仇祎诚，廖佳纯，牛力，沙枫，宋文杰，张磊，勾鹏，唐攀攀，刘昊，
申请(专利权)人：南湖实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人