一种侧重于分类任务的单样本目标检测方法技术

技术编号：26731474 阅读：35 留言：0更新日期：2020-12-15 14:34

本发明专利技术公开了一种侧重于分类任务的单样本目标检测方法。单样本目标检测任务是检测出询问图像中与单个参考实例图像类别一致的所有实例。通过观察发现，单样本目标检测性能有限的一个主要原因是由于其分类能力较差而产生许多假正例导致的，本发明专利技术基于此观察，提出了一种侧重于分类任务的单样本目标检测方法，该方法在两个重要方面进行了改进：本发明专利技术提出使用相同交并比阈值的分类级联网络，通过比较多个邻近区域来提高分类的鲁棒性；本发明专利技术还提出对询问实例特征和参考实例特征进行分类区域变形的网络，以获得更有效的比较区域。本发明专利技术的方法相比于基准方法，在训练过的类别和未训练过的类别两个指标上的准确度均有显著提高。

全部详细技术资料下载

【技术实现步骤摘要】
一种侧重于分类任务的单样本目标检测方法
本专利技术属于图像单样本目标检测
，具体是涉及一种侧重于分类任务的单样本目标检测方法。
技术介绍
近年来，基于卷积神经网络的目标检测方法取得了巨大的成功。但是，此成功依赖于由大量标注而成的大规模训练数据集，例如COCO数据集。通用的目标检测只能检测出训练集中标注过的物体类别，这使得通用目标检测方法难以扩展新的物体类别。一方面，执行大量的标注工作十分耗时，并且经常会出现错误的标注；另一方面，在某些特殊场景下很难收集大量的新类别图像。因此，当仅提供少量甚至一张实例图片示例时，模型依旧能够在询问图像中检测出和该实例类别一致的物体是有价值且必要的。之前的工作使用孪生网络结构来完成此任务，其中SiamMask通过在MaskR-CNN上添加比较匹配网络层来完成单样本实例分割，CoAE使用non-local和co-excitation来增强询问实例特征和参考实例特征之间的相关度。
技术实现思路
本专利技术的目的在于针对现有技术的不足，提出一种侧重于分类任务的单样本目标检测方法。通过预实验观察发现，与未在定位分支引入参考实例特征相比，当分类分支未引入参考实例特征时，会由于检测到更多的假正例而导致更明显的性能下降。上述观察激发本专利技术通过提高单样本目标检测网络的分类能力来降低假正例的数量，从而提高检测性能。本专利技术提出使用相同交并比阈值的分类级联网络，通过比较多个邻近区域来提高分类的鲁棒性；本专利技术还提出对询问实例特征和参考实例特征进行分类区域变形的网络，以获得更...

【技术保护点】
1.一种侧重于分类任务的单样本目标检测方法，其特征在于，该方法包括如下步骤：/n步骤1：读取数据集中训练样本的询问图像和参考实例图像，并读取和参考实例图像类别一致的询问图像中实例的类别标签和坐标位置，对输入询问图像和参考实例图像进行保持比例的缩放，并填充到固定大小，构成训练集；/n步骤2：在基准Siamese Faster R-CNN网络的基础上加入分类区域变形网络以及分类级联网络，形成侧重于分类任务的单样本目标检测网络；利用步骤1得到的训练集对单样本目标检测网络进行训练；/n步骤3：读取测试样本的询问图像和参考实例图像，输入到步骤2中的训练好的单样本目标检测网络中，获得每个检测实例的两个分类置信度和坐标位置；/n步骤4：将步骤3中每个实例预测的两个分类置信度进行加权作为该实例的最终分类置信度；将每个实例的坐标位置和对应的最终分类置信度输入到非极大抑制算法中对重叠度高于阈值的检测框进行过滤，从而实现单样本目标检测。/n

【技术特征摘要】
1.一种侧重于分类任务的单样本目标检测方法，其特征在于，该方法包括如下步骤：
步骤1：读取数据集中训练样本的询问图像和参考实例图像，并读取和参考实例图像类别一致的询问图像中实例的类别标签和坐标位置，对输入询问图像和参考实例图像进行保持比例的缩放，并填充到固定大小，构成训练集；
步骤2：在基准SiameseFasterR-CNN网络的基础上加入分类区域变形网络以及分类级联网络，形成侧重于分类任务的单样本目标检测网络；利用步骤1得到的训练集对单样本目标检测网络进行训练；
步骤3：读取测试样本的询问图像和参考实例图像，输入到步骤2中的训练好的单样本目标检测网络中，获得每个检测实例的两个分类置信度和坐标位置；
步骤4：将步骤3中每个实例预测的两个分类置信度进行加权作为该实例的最终分类置信度；将每个实例的坐标位置和对应的最终分类置信度输入到非极大抑制算法中对重叠度高于阈值的检测框进行过滤，从而实现单样本目标检测。

2.根据权利要求1所述的一种侧重于分类任务的单样本目标检测方法，其特征在于，所述步骤2中，基准SiameseFasterR-CNN网络是通过去掉SiamMask的语义分支后而生成的。

3.根据权利要求1所述的一种侧重于分类任务的单样本目标检测方法，其特征在于，所述步骤2中图像处理步骤如下：
步骤21：利用基准SiameseFasterR-CNN网络中共享权重的孪生ResNet网络提取询问图像和参考实例图像的特征图信息；
步骤22：利用度量学习网络提取询问特征图和参考特征图之间的相似度特征信息；把相似度特征信息输入到区域提议网络中生成提议区域，作为可能的检测框位置；
步骤23：在检测头中，重新计算每个提议区域的相似度特征信息，并将相似度特征信息输入到基准SiameseFasterR-CNN网络中的定位分支和分类级联网络构成的分类分支中。

4.根据权利要求3所述的一种侧重于分类任务的单样本目标检测方法，其特征在于，所述步骤23中重新计算每个提议区域的相似度特征信息的流程如下：
(1)将询问特征图中的提议区域作为询问实例特征，将参考特征图作为参考实例特征，将询问实例特征和参考实例特征输入到分类区域变形网络中进行分类区域变形，从而得到更有效的分类比较区域；
(2)将经过变形的询问实例特征和参考实例特征输入到度量学习网络中获得更有效的相似度特征图。

5.根据权利要求4所述的一种基于侧重于分类任务的单样本目标...

【专利技术属性】
技术研发人员：张宇，杨涵清，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人