当前位置: 首页 > 专利查询>东北大学专利>正文

一种基于优化锚框机制的目标检测方法技术

技术编号:34437440 阅读:49 留言:0更新日期:2022-08-06 16:22
本发明专利技术提供一种基于优化锚框机制的目标检测方法,涉及目标检测技术领域。该方法通过目标检测模型的骨架和颈部获得待检测实例图像对应的金字塔层级数量的特征图;再根据金字塔层级数量的特征图设计锚框参数,生成锚框;同时将特征图通过特征适应模块,得到新特征图;将新特征图和锚框输入至目标检测模型的头部进行训练;选出各个特征图的锚框的各种损失的平均值之和最小的那个特征图对目标检测模型进行训练;最后使用训练好的目标检测模型对待检测图像进行目标检测。该方法在前向运算中为目标检测模型设计锚框参数,减少了人工调整锚框超参数的成本。根据每一次前向训练的各损失均值之和进行特征图的选取和训练,从而达到训练上的最优化。训练上的最优化。训练上的最优化。

【技术实现步骤摘要】
一种基于优化锚框机制的目标检测方法


[0001]本专利技术涉及基于深度学习的目标检测
,尤其涉及一种基于优化锚框机制的目标检测方法。

技术介绍

[0002]目标检测是计算机视觉和数字图像处理的一个热门方向,广泛应用于机器人导航、智能视频监控、工业检测、航空航天等诸多领域,通过计算机视觉减少对人力资本的消耗,具有重要的现实意义。因此,目标检测也就成为了近年来理论和应用的研究热点,它是图像处理和计算机视觉学科的重要分支,也是智能监控系统的核心部分,同时目标检测也是泛身份识别领域的一个基础性的算法,对后续的人脸识别、步态识别、人群计数、实例分割等任务起着至关重要的作用。由于深度学习的广泛运用,目标检测算法得到了较为快速的发展。目标检测的任务是找出图像中所有感兴趣的目标(物体),确定它们的类别和位置,是计算机视觉领域的核心问题之一。由于各类物体有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具有挑战性的问题。
[0003]基于深度学习的目标检测算法成为现在目标检测领域的主流。基于深度学习的目标检测算法通常分为两种类型,分别为单阶段目标检测算法和二阶段目标检测算法。单阶段目标检测算法和二阶段目标检测算法并没有本质上的差别。顾名思义,二阶段目标检测算法由两个阶段组成:第一阶段叫做区域建议,是对图像进行处理,找到可能存在待检测目标所在的区域的一个阶段;第二阶段叫做分类回归阶段,是对前一个阶段产生的区域进行分类与位置预测的一个阶段。而单阶段目标检测算法没有区域建议阶段,而是直接对图像进行目标的定位与分类。
[0004]然而现在的主流的基于深度学习的目标检测算法,不论单阶段目标检测算法或者是二阶段目标检测算法都会使用到一个机制,那就是锚框机制,可以说锚框机制是当前目标检测算法的基石之一。锚框机制最先是在Faster R

CNN中引入的,是人工设定好的若干组固定大小以及宽高比的边界框。FasterR

CNN通过使用锚框取得了很不错的效果。锚框机制的出现解决了之前无锚框的方法难以解决的一些问题。尽管锚框对目标检测算法影响颇深,但是锚框机制也有其局限性,比如:对于不同问题必须人工设定不同大小以及形状的锚框;引入锚框的同时也引入了大量的计算成本等。

技术实现思路

[0005]本专利技术要解决的技术问题是针对上述现有技术的不足,提供一种基于优化锚框机制的目标检测方法,实现对图像目标的检测。
[0006]为解决上述技术问题,本专利技术所采取的技术方案是:一种基于优化锚框机制的目标检测方法,包括以下步骤:
[0007]步骤1:对带有真实框的待检测实例图像进行数据预处理,得到标准图像;
[0008]所述数据预处理包括:将图像重新调整至某一特定大小、数据增强和标准化操作;
[0009]步骤2:将预处理后的待检测实例图像输入目标检测模型的骨架—特征提取网络,得到特征图;
[0010]步骤3:将骨架部分输出的特征图输入目标检测模型的颈部—特征金字塔部分,获得金字塔层级数量的特征图;
[0011]步骤4:通过引导式锚框设计模块根据金字塔层级数量的特征图设计锚框参数,并且使用这些参数生成锚框;
[0012]步骤4.1:将步骤3获得的金字塔层级数量的特征图分别输入多组引导式锚框模块,得到特征图锚框参数;所述引导式锚框设计模块包括两个组件,分别是锚框位置预测组件以及锚框形状预测组件,这两个组件是平行的组件,故分别将各特征图分别输入进入这两个组件;
[0013]步骤4.1.1:将目标检测模型颈部——特征金字塔输出的特征图输入到位置预测组件,该组件使用一个1x1的卷积核扫描特征图,得到一个形状大小和原特征图一样的新特征图,然后这个新特征图再经过一个使用sigmoid函数作为激活函数的非线性层,将新特征图的各个点的值压缩至(0,1)之间,新特征图上的各个点的值用于表示原特征图上锚框存在于该点的概率;
[0014]步骤4.1.2:将目标检测模型颈部—特征金字塔输出的特征图输入到形状预测组件,该组件包含一个输出为2通道的卷积层,这个组件会使用两个1x1的卷积核扫描特征图,得到一个2通道的形状和原特征图一样的新特征图组,分别用于表示该特征图原特征图上该点锚框的宽和高;
[0015]步骤4.2:将步骤4.1得到的锚框参数:特征图锚框存在概率分数参数和特征图锚框宽高参数用于生成若干组新的锚框,用于之后在目标检测头部——分类器进行回归预测与分类预测;
[0016]步骤5:将目标检测模型颈部——特征金字塔输出的特征图通过一个特征适应模块,得到用于分类与回归的新特征图;
[0017]步骤6:将特征适应模块输出的新特征图和使用引导式锚框模块所输出锚框参数生成的锚框输入至目标检测模型的头部——分类器,并为待检测实例的真实框分配各个特征图上的若干锚框作为训练样本,将各个特征图所有落入待检测实例真实框框中心区域的锚框作为用于训练的正样本;
[0018]步骤7:通过在线特征选择机制收集各个特征图的锚框的各种损失的平均值之和;对比各个特征图的损失平均值之和,选出损失值之和最小的那个特征图,让目标检测模型使用该特征图对应的锚框和特征图进行训练,达到最优化特征选择的效果;
[0019]步骤7.1:计算待检测实例对应各个特征图的锚框的分类损失、回归损失、锚框形状损失,并计算各个损失值的平均值;
[0020]步骤7.2:找出待检测实例的各个损失值平均值之和最小的特征图的层级索引;
[0021]步骤7.3:将待检测实例所有不是该最小特征图所在层级的特征图上的所有锚框损失置为0,不将其用作训练;
[0022]步骤7.4:使用待检测实例各损失均值之和最小的特征图所在层级的特征图上的锚框作为训练的样本进行反向传播,从而对目标检测模型进行训练,直至目标检测模型收敛;
[0023]步骤8、将不带有真实框的待检测实例输入至训练好的目标检测模型,实现目标的检测。
[0024]采用上述技术方案所产生的有益效果在于:本专利技术提供的一种基于优化锚框机制的目标检测方法,(1)引导式锚框设计模块能够在前向运算中自动地、智能地为目标检测模型设计重要的锚框参数,减少了人工调整锚框超参数成本与训练模型所需要的物理显存。(2)传统锚框的很难利用到对某一检测实例最优的特征图来进行训练,本专利技术的在线特征选择机制可以冲破传统锚框的缺陷,能够根据每一次前向训练的各损失均值之和这一有效信息进行特征图的选取和训练,从而达到训练上的最优化。(3)本专利技术提供的方法可以集成在各种单阶段目标检测模型上,并且能保证对所集成的目标检测模型的检测精度有所增益,并且能够减少目标检测模型在进行训练的一些成本,如物理成本,人工成本等。(4)本专利技术提供的方法结合了现在时下较为流行的对锚框机制的两种改进,即将无锚框方向的一些较为优秀的机制,进行一定程度的调整,使其与之相悖的锚框机制结合起来,得到了一种全新的,具有两个方向优点的新方法,这种新方法具有可以本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于优化锚框机制的目标检测方法,获得待检测实例图像对应的金字塔层级数量的特征图;根据金字塔层级数量的特征图设计锚框参数,生成锚框;将特征图通过特征适应模块,得到新特征图;将新特征图和锚框输入至目标检测模型的头部进行训练;选出各个特征图的锚框的各种损失的平均值之和最小的那个特征图对目标检测模型进行训练;使用训练好的目标检测模型对待检测图像进行目标检测。2.根据权利要求1所述的一种基于优化锚框机制的目标检测方法,其特征在于:包括以下步骤:步骤1:对带有真实框的待检测实例图像进行数据预处理,得到标准图像;步骤2:将预处理后的待检测实例图像输入目标检测模型的骨架—特征提取网络,得到特征图;步骤3:将骨架部分输出的特征图输入目标检测模型的颈部—特征金字塔部分,获得金字塔层级数量的特征图;步骤4:通过引导式锚框设计模块根据金字塔层级数量的特征图设计锚框参数,并且使用这些参数生成锚框;步骤5:将目标检测模型颈部——特征金字塔输出的特征图通过一个特征适应模块,得到用于分类与回归的新特征图;步骤6:将特征适应模块输出的新特征图和使用引导式锚框模块所输出锚框参数生成的锚框输入至目标检测模型的头部——分类器,并为待检测实例的真实框分配各个特征图上的若干锚框作为训练样本,将各个特征图所有落入待检测实例真实框框中心区域的锚框作为用于训练的正样本;步骤7:通过在线特征选择机制收集各个特征图的锚框的各种损失的平均值之和;对比各个特征图的损失平均值之和,选出损失值之和最小的那个特征图,让目标检测模型使用该特征图对应的锚框和特征图进行训练,达到最优化特征选择的效果;步骤8、将不带有真实框的待检测实例输入至训练好的目标检测模型,实现目标的检测。3.根据权利要求2所述的一种基于优化锚框机制的目标检测方法,其特征在于:步骤1所述数据预处理包括:将图像重新调整至某一特定大小、数据增强和标准化操作。4.根据权利要求2所述的一种基于优化锚框机制的目标检测方法,其特征在于:所述步骤4的具体方法为:步骤4.1:将步骤3获得的金字塔层级数量的特征图分别输入多组引导...

【专利技术属性】
技术研发人员:梁哲喆于海王莹朱志良
申请(专利权)人:东北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1