一种基于anchor自学习的目标检测方法技术

技术编号:38935028 阅读:18 留言:0更新日期:2023-09-25 09:37
本发明专利技术公开一种基于anchor自学习的目标检测方法,属于目标检测技术领域。通过设计基于anchor的目标检测网络结构实现,该目标检测网络结构由一个主干网络和两个完全连接的分支两部分构成。在faster

【技术实现步骤摘要】
一种基于anchor自学习的目标检测方法


[0001]本专利技术涉及目标检测
,具体涉及一种基于anchor自学习的目标检测方法。

技术介绍

[0002]目标检测领域发展至今已经广泛应用于自动驾驶、灾害搜救、遥感目标检测、医学病变检测、工业检测等诸多领域,它是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分,同时目标检测也是泛身份识别领域的一个基础性的算法,对后续的人脸识别、步态识别、人群计数、实例分割等任务起着至关重要的作用。该方法通过计算机视觉减少对人力资本的消耗,具有重要的现实意义。近几年来,由于深度学习的广泛运用,目标检测算法得到了较为快速的发展,但在一些领域还存在可靠性低、检测准确率不高的问题。本专利技术公开一种基于anchor机制的深度学习目标检测的方法,不仅能够实现目标检测器从端到端进行检测,而且提升了目标检测的准确率和鲁棒性。
[0003]深度学习是机器学习领域中一个新的研究方向,其深度体现在对特征的多次变换上。常用的深度学习模型为多层神经网络,神经网络的每一层都会将输入进行非线性映射,通过多层非线性映射的堆叠,在深层神经网络中计算出抽象的特征来帮助分类。其含有多层网络模型,并且学习过程也是由低到高逐层映射到新的特征空间,具有层次化和分布式抽象的特点,这样可以拟合复杂的非线性函数,处理更高维度的非线性输入数据。深度学习网络结构进行学习有3个特点,即,利用无监督学习来对每一层网络进行预训练;每次用无监督学习只训练一层,并将输出的训练结果作为其高一层的输入;用自顶而下的监督算法去调整所有层。近些年来,深度学习引起了计算机视觉、目标检测、自然语言处理、语音识别等领域的广泛关注,并取得了很多成果。
[0004]由于深度学习的广泛运用,目标检测算法得到了较为快速的发展。在目标检测算法中,有多种分类方式,主要有基于有无anchor的划分方式,即,anchor

based算法和anchor

free算法。基于anchor

free的算法不使用anchor机制,是利用其他方法进行目标检测,然而,不管是keypoint

based的方法还是pixel

wise prediction的方法,本质上都是密集的预测的方法,这些方法得到的解空间使得简单的anchor

free的方法容易得到过多的被模型预测为正的负样本,而获得高召回率但是低精度的检测结果。因此,基于anchor

free的目标检测算法容易获得大量的负样本,检测准确率普遍不高,检测结果不稳定,需要大量的后期处理。相比于anchor

based算法,anchor

free由于预测关键点,导致正负样本不均衡、定位不准,检测准确率普遍较低。基于anchor

based的目标检测方法利用anchor机制产生大量的候选区域,然后对这些候选区域进行分类与位置回归。该方法可以分为单阶段目标检测算法和二阶段目标检测算法两种方式。大量研究表明,两阶段算法普遍比一阶段算法准确率高。两阶段算法主要是利用anchor机制产生大量的候选区域,这些候选区域中很有可能包含目标,然后再利用深度学习对候选区域进行回归定位与分类操作,最终获得目标的位置与种类。一阶段算法相比二阶段目标检测算法,并没有对产生的候
选区域进行筛选,而是直接对特征图的所有候选区域进行回归与定位操作。这样的方式会出现大量的负样本,导致准确率和可靠性较低。
[0005]由此看出,目标检测算法不管是一阶段还是两阶段,大部分都是基于anchor进行目标检测的,利用anchor机制产生候选区域,然后进行后续检测。因此,基于anchor的检测算法检测率的提高与候选区域的选取有重要关系,候选区域是否选的好,主要与anchor有关,而anchor的好坏取决于anchor的基本尺度与长宽比。目前,目标检测算法关于anchor的设计主要取决于人为设计,而不同的数据集需要人为设计不同的anchor尺寸与形状,通过人为设计的anchor scales和aspect ratios需要设计者具有很强的经验,设计出的anchor尺寸通常带有很强的主观性,且该设计主要是针对通用目标进行设计,而往往忽略非通用目标,导致检测器主要针对的是通用目标检测,而忽略非通用目标检测。有的方法则直接使用基本的聚类算法,聚类出几个固定尺寸,例如yolov2,通过聚类算法可以在一定程度上解决人为设计带来的偶然性,然而聚类算法对异常值比较敏感,很容易产生偏差,导致聚类不准确,同样无法使anchor scales与aspect ratios达到最优。
[0006]综上,为了摆脱上述两种方法设计带来的缺陷,本专利主要是在基于anchor的检测算法上进行改进,以提高目标检测的准确率和可靠性。

技术实现思路

[0007]本专利技术的主要目的是公开一种基于anchor自学习的目标检测方法,解决基于anchor的目标检测算法对数据没有自适应能力的技术问题。设计的方法能够解决凭经验人为设计anchor大小或者使用聚类方法直接聚类出anchor尺寸的问题,让算法具有数据自适应能力,且可以镶嵌进任何一种目标检测算法,实现对目标的全覆盖,具有较好的准确性和鲁棒性。
[0008]为达到上述目的,解决上述技术问题,本专利技术的技术方案如下:
[0009]一种基于anchor自学习的目标检测方法,通过设计基于anchor的目标检测网络结构实现;
[0010]设计的目标检测网络结构分为两部分,一部分是用于预测anchor scales与aspect ratios的生成网络,另一部分是Faster R

CNN的RPN网络;具体的设计过程如下:
[0011]预测anchor scales与aspect ratios的生成网络是指在Faster R

CNN算法的anchor生成结构上增加一个学习anchor scales与aspect ratios的网络模块,用于学习到anchor的最佳形状;
[0012]预测anchor scales与aspect ratios的生成网络输入的数据为RGB和ground

truth mask图像数据组成的四通道数据,Faster R

CNN的RPN网络输入为RGB三通道图像数据;
[0013]为了学习到anchor的最佳形状,利用主干网络最后一层的特征图来预测anchor scales;主干网络的最后一层的特征图总共输出35*1个矢量值,将其转换为5*7矩阵,利用softmax函数对每行进行操作,使输出的数据在0到1之间,最后将每行数据乘以设计的初始anchor scales,通过与初始anchor scales相乘,anchor scales的取值在8到512之间;这里初始anchor scales设为(8,16,32,6本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于anchor自学习的目标检测方法,其特征在于,所述的目标检测方法通过设计基于anchor的目标检测网络结构实现;设计的目标检测网络结构分为两部分:两个完全连接的分支和主干网络;两个完全连接的分支是用于预测anchorscales与aspectratios的学习器网络,主干网络是FasterR

CNN的RPN网络;具体的设计过程如下:所述的预测anchorscales与aspectratios的学习器网络是指在FasterR

CNN算法的anchor生成结构上增加一个学习anchorscales与aspectratios的网络模块,用于自动学习anchor的最佳形状;所述的预测anchorscales与aspectratios的学习器网络输入的数据为RGB和ground

truthmask图像数据组成的四通道数据,FasterR

CNN的RPN网络输入为RGB三通道图像数据;为了学习到anchor的最佳形状,利用主干网络最后一层的特征图来预测anchorscales;主干网络的最后一层的特征图总共输出35*1个矢量值,将其转换为5*7矩阵,利用softmax函数对每行进行操作,使输出的数据在0到1之间,最后将每行数据乘以设计的初始anchorscales,通过与初始anchorscales相乘,anchorscales的取值在8到512之间;这里初始anchorscales设为(8,16,32,64,128,256,512);同时为了学习到anchor的最佳形状,利用主干网络最后一层的特征图来预测aspectratios;首先,主干网络最后一层的特征图通过全连接层生成18*1个矢量值,将其转换为3*6矩阵,再利用softmax函数对每行进行操作,使输出的数据在0到1之间,最后将每行数据乘以设计的初始aspectratios;通过与初始aspectratios相乘,aspectratios的取值在0.1到2.5之间;这里初始aspectratios设为(0.1,0.5,1.0,1.5,2.0,2.5);设计的网络模块中anchorscales与aspe...

【专利技术属性】
技术研发人员:郭鸿博王晓斌朱得糠孟志鹏
申请(专利权)人:中国人民解放军军事科学院国防科技创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1