一种基于注意力和对比学习的小样本目标检测方法技术

技术编号：30055716 阅读：33 留言：0更新日期：2021-09-15 10:59

本发明专利技术涉及了一种基于注意力和对比学习的小样本目标检测方法，属于人工智能、图像处理领域。本发明专利技术为一种结合了数据增强、注意力区域建议网络(AttentionRPN)、对比学习的小样本目标检测方法。该方法基于FasterR

全部详细技术资料下载

【技术实现步骤摘要】
一种基于注意力和对比学习的小样本目标检测方法

[0001]本专利技术涉及一种小样本目标检测的方法，具体设计了一种基于注意力和对比学习的小样本目标检测方法，属于人工智能、图像处理领域。

技术介绍

[0002]目标检测是在图片中同时检测出目标和标定目标位置，故目标检测的任务比图片分类要复杂，不仅涉及分类任务也涉及回归任务。由于数据样本一方面有长尾分布特征，另一方面有的样本获取困难，标注代价巨大。故目标检测也存在小样本问题，即在样本量丰富的基类样本训练后，再在样本量稀少的小样本新类上作微调训练，使模型能在新类上的检测性能堪比基类检测性能。由于目标检测比分类的任务更加复杂，故小样本目标检测不能单纯的从小样本分类任务移植现成的技术。
[0003]卷积神经网络(CNNs)的发展给一般目标检测带来了巨大的进步。深度学习目标检测器需要大量带注释的训练数据来提升其性能。在小样本学习场景中，目标检测器存在严重的过拟合，小样本目标检测与一般目标检测之间的差距比小样本图像分类中相应的差距更大。因此小样本目标检测的模型要比小样本图像分类要复杂得多。
[0004]对比学习与注意力网络逐渐被很多人用于提高模型性能。其中对比学习自监督模式的成功归功于人们对对比学习的重新研究。优化对比实例同时最大化相似实例(定义为正对)之间的一致性，并鼓励不同实例或负对之间的差异。通过对比学习，该网络学习构建不集中于像素级细节的表示，而是编码足以区分不同图像的高级特征。然而监督对比学习将批量对比方法扩展到监督训练中，但是它们用于图像分类中。通过将对比...

【技术保护点】

【技术特征摘要】
1.一种基于注意力和对比学习的小样本目标检测方法，其特征在于：基于小样本马赛克数据增强模块、坐标补偿注意力区域提议网络、新旧类判别模块和对比学习模块，各模块具体构成如下：小样本马赛克数据增强模块，包括样本选择策略、马赛克数据增强方法；坐标补偿注意力区域提议网络，包括区域提议网络、回归坐标补偿注意力分支、坐标补偿损失；新旧类判别模块，包括特征提取层、类别判别层；对比学习模块，包括特征映射层、对比损失和联合训练策略；方法的具体步骤如下：(1)小样本马赛克数据增强模块从基类和新类训练样本随机选取样本后生成训练样本；(2)FasterR
‑
CNN按照步骤(1)所产生的训练样本经过主干网络ResNet 101进行特征提取，后接特征金字塔网络产生主干输出特征：P2、P3、P4、P5、P6；(3)坐标补偿注意力区域提议网络以步骤(2)所产生的主干输出特征为输入，送入3x3卷积特征提取特征，接1x1卷积网络分别产出回归坐标预测和前景背景分类预测，同时也送入回归坐标补偿注意力分支生成回归坐标补偿，最终的坐标预测由前述的回归坐标预测与回归坐标补偿生成，再经过锚框生成器和后处理得到建议区域；(4)ROIPooling层根据步骤(3)生成的建议区域对步骤(2)生成的P2、P3、P4、P5、P6特征进行ROIPooling操作生成特征R；(5)步骤(4)所生成的特征R同时送入ROI特征提取模块ROIHead和新旧类判别模块Discriminator；(6)新旧类判别模块将特征R送入两层全连接层后生成关于新类与基类的二分类预测分数；(7)ROI特征提取模块有两层全连接层将特征R提取为1024维的特征F，同时送入框坐标回归头Regression、分类头Classification和对比学习头Contrastiveleaming，其中回归头Regression和分类头Classification结果通过后处理生成最终检测结果。2.根据权利要求1所述的基于注意力和对比学习的小样本目标检测方法，其特征在于：小样本马赛克数据增强模块具体运行步骤包括：(2.1)按比例分别从基类样本集D
base
和新类样本集D
novel
中抽取样本；(2.2)每4张样本按新类与基类1∶3的比例，分别采用不同的数据增强方法处理后以某一随机的尺寸裁剪后拼接为一张样本，目的是为了让稀有的新类样本充分地与基类样本混合在一起，一方面从图片级作数据增强，另一方面为后续实例级对比学习作铺垫；(2.3)反复重复步骤(2.2)生成批次大小的训练样本D
train
。3.根据权利要求1所述的基于注意力和对比学习的小样本目标检测方法，其特征在于：坐标补偿注意力区域提议网络具体运行步骤包括：(3.1)将FPN的输出特征输入一层3x3卷积网络生成特征A；(3.2)将步骤(3.1)生成的特征A分别通过两层1x1卷积为每个像素点生成前景背景预测分数与回归坐标预测j∈(0，1)，0代表前景得分，1代表背景得分，i∈(0，1，2，3)分别代表中心(x，y)和宽高(w，h)的值；
(3.3)步骤(3.1)生成的特征A也送入了回归坐标补偿注意力分支生成补偿坐标其运算...

【专利技术属性】
技术研发人员：王蒙，王强，陈家兴，李鑫凯，邵逸轩，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人