级联目标检测系统中的渐变式分类损失计算方法及系统技术方案

技术编号:21142043 阅读:27 留言:0更新日期:2019-05-18 05:25
本发明专利技术涉及一种级联目标检测系统中的渐变式分类损失计算方法及系统,其包括:被作为训练样本的锚框对应的区域与目标框相互重叠部分的尺度和位置,以及锚框的感受野呈高斯分布的特点,计算该锚框对应区域内各个类别的感受野权重;通过感受野权重和该锚框的分类结果计算出该锚框属于每个类别的概率,结合Softmax函数表达式和焦点损失表达式,依次计算出该锚框属于每个类别的概率和分类结果的渐变式分类损失;利用链式求导法则,计算得到该锚框的分类结果的渐变式分类损失在该链路权重处的梯度。本发明专利技术通过优化级联目标检系统中各个阶段的分类损失,增强系统排除干扰性特征发现目标的能力,从而提高目标检测的精确性,并能有效节省人力、物力和时间成本。

【技术实现步骤摘要】
级联目标检测系统中的渐变式分类损失计算方法及系统
本专利技术涉及一种模式识别领域中计算机视觉方向的计算方法及系统,特别是关于一种级联目标检测系统中的渐变式分类损失计算方法及系统。
技术介绍
在近年来基于卷积神经网络的目标检测系统中,越来越多的算法采用级联式的多个检测器,使系统在原始图像中关注的区域(即锚框在原图中对应的区域)的尺度和位置逐步逼近作为系统希望获得的结果的目标框(groundtruthbox)的尺度和位置,从而提高目标检测的精度。上述系统中,对于目标分类结果的损失,普遍的做法是直接采用将锚框(anchor)属于每个类别的概率代入到基于交叉熵或Softmax函数制定的焦点损失或其他损失函数中最终获得的结果,并且级联目标检测系统的每个阶段使用的分类损失全部采用同样的计算方法。显而易见,含有上述方法的目标检测系统的优点是简单易行,不需要分别为每个阶段制定单独的分类损失计算方法。但是其缺点也很明显,随着锚框的尺度和位置逐步逼近作为系统希望获得的结果的目标框,实际上锚框在原图中对应的区域所包含的物体特征也在一直变化,其变化趋势是:在级联系统靠前的阶段,锚框与目标框的匹配精度较低,其对应的区域中混有大量其他物体或背景的干扰性特征;而级联系统靠后的阶段,锚框与目标框的匹配精度显著增高,其对应的区域中目标物体的特征开始占据主导地位。如果简单粗暴的在从前到后各个不同的阶段使用完全相同的分类损失计算方法,其计算出的结果显然无法同时适应各个阶段的锚框对应区域框住的目标特征和干扰性特征各自不同的比例,尤其是在靠前的阶段,干扰性特征甚至可能占据较大的比例,此时如果强迫系统将该锚框分类成目标,反而会干扰目标分类功能的训练,造成其无法正确学习到目标本身的关键特征及其与属于背景或其它类型目标造成的干扰性特征的区别,从而难以收敛。而且这种与锚框感受野中出现的特征不匹配的分类训练还会随着网络中为分类、位置回归等功能提取特征的结构中大量共享参数的更新,最终影响整个级联目标检测系统的性能。而实际上,在级联目标检测算法的卷积神经网络中,每个被作为训练样本的锚框对应的区域与目标框相互重叠部分的尺度和位置,以及锚框的感受野呈高斯分布的特点中蕴含着大量的语义信息,这些信息对于评估各个阶段的锚框对应区域框住的目标特征和干扰性特征各自不同的比例具有重要的参考意义。在传统的级联目标检测系统中,上述信息甚至完全没有参与分类损失的计算和算法的训练,就被直接丢弃了,这对于目标检测任务来说,无疑是一种巨大的资源浪费。综上所述,在级联目标检测系统中,传统的分类损失计算方法简单粗暴的在从前到后各个不同的阶段使用完全相同的分类损失计算方法,其未考虑不同阶段的锚框对应区域中包含的目标特征和干扰性特征的比例差异,不能充分利用作为训练样本的锚框对应的区域与目标框相互重叠部分的尺度和位置,以及锚框的感受野呈高斯分布的特点中蕴含的语义信息,导致系统无法充分发挥级联目标检测系统拥有多次检测机会、可以分阶段逐步使锚框以比单次检测更高的精度逼近目标框的优势,从而难以保证目标检测的精确性。
技术实现思路
针对级联目标检测系统中传统的分类损失计算方法并未充分利用作为训练样本的锚框(anchor)对应的区域与目标框(groundtruthbox)相互重叠部分的尺度和位置,以及锚框的感受野呈高斯分布的特点中蕴含的语义信息,导致系统无法充分发挥级联目标检测系统拥有多次检测机会、可以分阶段逐步使锚框以比单次检测更高的精度逼近目标框的优势,从而难以保证目标检测的精确性这一问题。本专利技术的目的是提供一种级联目标检测系统中的渐变式分类损失计算方法及系统,其能提高目标检测精确性,并能有效节省人力、物力和时间成本。为实现上述目的,本专利技术采取以下技术方案:一种级联目标检测系统中的渐变式分类损失计算方法,其包括以下步骤:1)根据目标检测算法中每个被作为训练样本的锚框对应的区域与目标框相互重叠部分的尺度和位置,以及锚框的感受野呈高斯分布的特点,计算该锚框对应区域内各个类别的感受野权重;2)根据级联目标检测系统针对被作为训练样本的锚框的分类结果,以及该锚框对应的区域内每个类别的感受野权重,计算出该锚框对应的区域内每个类别的渐变式分类权重,将渐变式分类权重带入Softmax函数表达式,计算出该锚框属于每个类别的概率,再将该锚框属于每个类别的概率带入焦点损失表达式,计算出该锚框的分类结果的渐变式分类损失;3)根据链式求导法则,依次计算出级联目标检测系统针对被作为训练样本的锚框的分类结果的渐变式分类损失对该锚框属于分类结果对应的类别的概率的偏导数、该锚框属于分类结果对应的类别的概率对网络各个类别输出结果的偏导数以及各个类别输出结果对相关链路的偏导数,再将上述3个偏导数的乘积作为目标检测系统针对被作为训练样本的锚框的分类结果的渐变式分类损失在该链路权重处的梯度。进一步,所述步骤1)中,被作为训练样本的锚框对应的区域内各个类别感受野权重的计算方法包括以下步骤:1.1)获取该锚框对应的区域内各个像素点所属的类别;1.2)计算该锚框对应的区域内各个像素点的感受野权重:采用离散二维高斯函数来赋予位于该锚框内部不同位置的像素点不同的感受野权重;1.3)计算该锚框对应的区域内各个类别的感受野权重:对于该锚框的对应区域,采用属于每个类别的像素点的感受野权重之和,作为该锚框的对应区域该类别c的感受野权重w_rfc;1.4)重复步骤1.1)至1.3),直到获得所有被作为训练样本的锚框对应的区域内每个类别的感受野权重。进一步,所述步骤1.1)中,对于目标检测算法中每个被作为训练样本的锚框对应的区域内各个像素点,如果该像素点位于第c个类别的第m个目标框oc,m对应的区域内部,则判定该像素点属于该目标框对应的类别c,如果该像素点位于多个不同类别的目标框内部的重叠区域,则判定该像素点属于面积最小的目标框对应的类别;如果该像素点未处于任何目标框对应区域内部,则判定该像素点属于背景类别;其中,c∈{1,…,C},C为类别总数;m为任意正整数。进一步,所述步骤1.2)中,锚框对应区域内编号为(i,j)的像素点的感受野权重w_di,j为:其中,锚框宽度方向的方差σw和高度方向的方差σh的数值均等于1,A为使得锚框内部各个像素点的感受野权重相加之和等于1的常数,lw,i与lh,i分别为锚框内部编号为(i,j)的像素点与锚框中心点在宽度方向和高度方向上的归一化距离。进一步,所述步骤2)中,被作为训练样本的锚框的渐变式分类损失计算方法包括以下步骤:2.1)计算级联目标检测系统针对被作为训练样本的锚框的各个类别的渐变式分类权重;2.2)计算级联目标检测系统针对被作为训练样本的锚框属于每个类别的概率:当级联目标检测系统针对被作为训练样本的锚框的各个类别的渐变式分类权重被计算出来后,将渐变式分类权重带入Softmax函数表达式,获得该锚框被级联目标检测系统的第t个阶段判断为属于类别c的概率pc,t;2.3)计算级联目标检测系统针对被作为训练样本的锚框的分类结果的渐变式分类损失:将步骤2.2)中计算出的被作为训练样本的锚框被级联目标检测系统的第t个阶段判断为属于类别c的概率pc,t带入焦点损失的表达式,求得级联目标检测系统第t个阶段针对该锚框的分类结果本文档来自技高网
...

【技术保护点】
1.一种级联目标检测系统中的渐变式分类损失计算方法,其特征在于包括以下步骤:1)根据目标检测算法中每个被作为训练样本的锚框对应的区域与目标框相互重叠部分的尺度和位置,以及锚框的感受野呈高斯分布的特点,计算该锚框对应区域内各个类别的感受野权重;2)根据级联目标检测系统针对被作为训练样本的锚框的分类结果,以及该锚框对应的区域内每个类别的感受野权重,计算出该锚框对应的区域内每个类别的渐变式分类权重,将渐变式分类权重带入Softmax函数表达式,计算出该锚框属于每个类别的概率,再将该锚框属于每个类别的概率带入焦点损失表达式,计算出该锚框的分类结果的渐变式分类损失;3)根据链式求导法则,依次计算出级联目标检测系统针对被作为训练样本的锚框的分类结果的渐变式分类损失对该锚框属于分类结果对应的类别的概率的偏导数、该锚框属于分类结果对应的类别的概率对网络各个类别输出结果的偏导数以及各个类别输出结果对相关链路的偏导数,再将上述3个偏导数的乘积作为目标检测系统针对被作为训练样本的锚框的分类结果的渐变式分类损失在该链路权重处的梯度。

【技术特征摘要】
1.一种级联目标检测系统中的渐变式分类损失计算方法,其特征在于包括以下步骤:1)根据目标检测算法中每个被作为训练样本的锚框对应的区域与目标框相互重叠部分的尺度和位置,以及锚框的感受野呈高斯分布的特点,计算该锚框对应区域内各个类别的感受野权重;2)根据级联目标检测系统针对被作为训练样本的锚框的分类结果,以及该锚框对应的区域内每个类别的感受野权重,计算出该锚框对应的区域内每个类别的渐变式分类权重,将渐变式分类权重带入Softmax函数表达式,计算出该锚框属于每个类别的概率,再将该锚框属于每个类别的概率带入焦点损失表达式,计算出该锚框的分类结果的渐变式分类损失;3)根据链式求导法则,依次计算出级联目标检测系统针对被作为训练样本的锚框的分类结果的渐变式分类损失对该锚框属于分类结果对应的类别的概率的偏导数、该锚框属于分类结果对应的类别的概率对网络各个类别输出结果的偏导数以及各个类别输出结果对相关链路的偏导数,再将上述3个偏导数的乘积作为目标检测系统针对被作为训练样本的锚框的分类结果的渐变式分类损失在该链路权重处的梯度。2.如权利要求1所述方法,其特征在于:所述步骤1)中,被作为训练样本的锚框对应的区域内各个类别感受野权重的计算方法包括以下步骤:1.1)获取该锚框对应的区域内各个像素点所属的类别;1.2)计算该锚框对应的区域内各个像素点的感受野权重:采用离散二维高斯函数来赋予位于该锚框内部不同位置的像素点不同的感受野权重;1.3)计算该锚框对应的区域内各个类别的感受野权重:对于该锚框的对应区域,采用属于每个类别的像素点的感受野权重之和,作为该锚框的对应区域该类别c的感受野权重w_rfc;1.4)重复步骤1.1)至步骤1.3),直到获得所有被作为训练样本的锚框对应的区域内每个类别的感受野权重。3.如权利要求2所述方法,其特征在于:所述步骤1.1)中,对于目标检测算法中每个被作为训练样本的锚框对应的区域内各个像素点,如果该像素点位于第c个类别的第m个目标框oc,m对应的区域内部,则判定该像素点属于该目标框对应的类别c,如果该像素点位于多个不同类别的目标框内部的重叠区域,则判定该像素点属于面积最小的目标框对应的类别;如果该像素点未处于任何目标框对应区域内部,则判定该像素点属于背景类别;其中,c∈{1,…,C},C为类别总数;m为任意正整数。4.如权利要求2所述方法,其特征在于:所述步骤1.2)中,锚框对应区域内编号为(i,j)的像素点的感受野权重w_di,j为:其中,锚框宽度方向的方差σw和高度方向的方差σh的数值均等于1,A为使得锚框内部各个像素点的感受野权重相加之和等于1的常数,lw,i与lh,i分别为锚框内部编号为(i,j)的像素点与锚框中心点在宽度方向和高度方向上的归一化距离。5.如权利要求1所述方法,其特征在于:所述步骤2)中,被作为训练样本的锚框的渐变式分类损失计算方法包括以下步骤:2.1)计算级联目标检测系统针对被作为训练样本的锚框的各个类别的渐变式分类权重;2.2)计算级联目标检测系统针对被作为训练样本的锚框属于每个类别的概率:当级联目标检测系统针对被作为训练样本的锚框的各个类别的渐变式分类权重被计算出来后,将渐变式分类权重带入Softmax函数表达式,获得该锚框被级联目标检测系统的第t个阶段判断为属于类别c的概率pc,t;2.3)计算级联目标检测系统针对被作为训练样本的锚框的分类结果的渐变式分类损失:将步骤2.2)中计算出的被作为训练样本的锚框被级联目标检测系统的第t个阶段判断为属于类别c的概率pc,t带入焦点损失的表达式,求得级联目标检测系统第t个阶段针对该锚框的分类结果为类别c时的渐变式分类损失FLc,t:FLc,t=-(1-pc,t)γlnpc,t其中,γ为可调整的系数;2.4)重复步骤2.1)至2.3),直到获得级联目标检测系统各个阶段针对所有被作为训练样本的锚框各自的分类结果的渐变式分类损失。6.如权利要求5所述方法,其特...

【专利技术属性】
技术研发人员:刘阳倪国栋李兵李洪研沈志忠朱昂
申请(专利权)人:通号通信信息集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1