一种基于判别性区域定位的图像数据增广方法技术

技术编号：30075327 阅读：63 留言：0更新日期：2021-09-18 08:30

本发明专利技术公开了一种基于判别性区域定位的图像数据增广方法，采用CAM方法计算原始图像的类激活图，并通过将所述类激活图上采样和取阈值来定位判别性区域；数据增广操作包括两种，其中区域裁剪是通过在判别性区域中随机采样一个正方形区域，并基于所述正方形区域对原始图像进行裁剪；区域混合是随机取两张不同类别的图片，分别求出两张图片的判别性区域掩膜，再根据所述掩膜将两张图片的判别性区域和非判别性区域进行混合；每轮迭代都由原始图像生成增广样本，并与下一轮迭代的原始图像一起组成下一轮迭代的训练样本，直至训练结束。本发明专利技术可以解决传统方法生成的样本由于没有包含足够多的判别性信息而成为噪声样本的问题。含足够多的判别性信息而成为噪声样本的问题。含足够多的判别性信息而成为噪声样本的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于判别性区域定位的图像数据增广方法

[0001]本专利技术涉及计算机视觉
，尤其涉及一种基于判别性区域定位的图像数据增广方法。

技术介绍

[0002]在图像分类问题中，数据增广是一种常用的正则化方法。在图像数据增广方法中，区域裁剪和区域混合是两种常用的增广操作，但在传统的方法中，这两种操作都是按预定的概率随机地对原始数据做变换，并不考虑数据本身的分布以及模型对数据的偏好，没有充分利用数据中的有用信息，限制了数据增广对模型性能的提升作用。具体地说，传统的区域裁剪是随机地从原始图像中裁剪出部分区域，但可能裁剪的区域没有包含足够的有效信息，此时裁剪得到的新样本相当于噪声样本，对模型性能的提升几乎没有帮助；而传统的区域混合则以CutMix为代表，是随机地从两张图片中取出两个互补区域进行混合，混合后的图片的类别标签也是由两张原始图片的类别标签通过混合得到的。CutMix没有考虑从两张原始图片中取出的区域是否包含足够的判别性信息，生成的样本可能会由于没有包含足够多的判别性信息而成为噪声样本。

技术实现思路

[0003]本专利技术的目的在于提供一种基于判别性区域定位的图像数据增广方法，解决生成的样本由于没有包含足够多的判别性信息而成为噪声样本的问题。
[0004]为实现上述目的，本专利技术提供了一种基于判别性区域定位的图像数据增广方法，包括以下步骤：
[0005]采用CAM方法计算原始图像的类激活图，并通过将所述类激活图上采样和取阈值来定位判别性区域；
[0006]在所述判别性区

【技术保护点】

【技术特征摘要】
1.一种基于判别性区域定位的图像数据增广方法，其特征在于，包括以下步骤：采用CAM方法计算原始图像的类激活图，并通过将所述类激活图上采样和取阈值来定位判别性区域；在所述判别性区域内随机采样一个正方形区域，并基于所述正方形区域对所述原始图像进行裁剪和缩放；基于随机获取的两种类别的图片的判别性区域掩膜生成对应的混合掩膜，并将两种类别的所述图片的判别性区域和非判别性区域进行混合；每轮迭代开始时都从训练集中选出多张图像作为原始图像，每轮迭代结束时则由所述原始图像生成若干增广样本；其中，每轮迭代的训练样本由上一轮迭代生成的增广样本和本轮迭代的所述原始图像组成；如此反复迭代直至满足训练结束条件。2.如权利要求1所述的基于判别性区域定位的图像数据增广方法，其特征在于，采用CAM方法计算原始图像的类激活图，并通过将所述类激活图上采样和取阈值来定位判别性区域，包括：采用CAM方法计算出所述原始图像真实类别的类激活图；将所述类激活图上采样至与所述原始图像相同大小，然后将所述类激活图中的所有像素值归一化至[0,1]之间。基于设定的阈值，将归一化后的所述类激活图中像素值大于所述阈值的区域作为判别性区域。3.如权利要求2所述的基...

【专利技术属性】
技术研发人员：徐智，宁文昌，李智，
申请(专利权)人：桂林电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人