【技术实现步骤摘要】
级联目标检测系统中的渐变式分类损失计算方法及系统
本专利技术涉及一种模式识别领域中计算机视觉方向的计算方法及系统,特别是关于一种级联目标检测系统中的渐变式分类损失计算方法及系统。
技术介绍
在近年来基于卷积神经网络的目标检测系统中,越来越多的算法采用级联式的多个检测器,使系统在原始图像中关注的区域(即锚框在原图中对应的区域)的尺度和位置逐步逼近作为系统希望获得的结果的目标框(groundtruthbox)的尺度和位置,从而提高目标检测的精度。上述系统中,对于目标分类结果的损失,普遍的做法是直接采用将锚框(anchor)属于每个类别的概率代入到基于交叉熵或Softmax函数制定的焦点损失或其他损失函数中最终获得的结果,并且级联目标检测系统的每个阶段使用的分类损失全部采用同样的计算方法。显而易见,含有上述方法的目标检测系统的优点是简单易行,不需要分别为每个阶段制定单独的分类损失计算方法。但是其缺点也很明显,随着锚框的尺度和位置逐步逼近作为系统希望获得的结果的目标框,实际上锚框在原图中对应的区域所包含的物体特征也在一直变化,其变化趋势是:在级联系统靠前的阶段,锚框与目标框的匹配精度较低,其对应的区域中混有大量其他物体或背景的干扰性特征;而级联系统靠后的阶段,锚框与目标框的匹配精度显著增高,其对应的区域中目标物体的特征开始占据主导地位。如果简单粗暴的在从前到后各个不同的阶段使用完全相同的分类损失计算方法,其计算出的结果显然无法同时适应各个阶段的锚框对应区域框住的目标特征和干扰性特征各自不同的比例,尤其是在靠前的阶段,干扰性特征甚至可能占据较大的比例,此时如果强迫系 ...
【技术保护点】
1.一种级联目标检测系统中的渐变式分类损失计算方法,其特征在于包括以下步骤:1)根据目标检测算法中每个被作为训练样本的锚框对应的区域与目标框相互重叠部分的尺度和位置,以及锚框的感受野呈高斯分布的特点,计算该锚框对应区域内各个类别的感受野权重;2)根据级联目标检测系统针对被作为训练样本的锚框的分类结果,以及该锚框对应的区域内每个类别的感受野权重,计算出该锚框对应的区域内每个类别的渐变式分类权重,将渐变式分类权重带入Softmax函数表达式,计算出该锚框属于每个类别的概率,再将该锚框属于每个类别的概率带入焦点损失表达式,计算出该锚框的分类结果的渐变式分类损失;3)根据链式求导法则,依次计算出级联目标检测系统针对被作为训练样本的锚框的分类结果的渐变式分类损失对该锚框属于分类结果对应的类别的概率的偏导数、该锚框属于分类结果对应的类别的概率对网络各个类别输出结果的偏导数以及各个类别输出结果对相关链路的偏导数,再将上述3个偏导数的乘积作为目标检测系统针对被作为训练样本的锚框的分类结果的渐变式分类损失在该链路权重处的梯度。
【技术特征摘要】
1.一种级联目标检测系统中的渐变式分类损失计算方法,其特征在于包括以下步骤:1)根据目标检测算法中每个被作为训练样本的锚框对应的区域与目标框相互重叠部分的尺度和位置,以及锚框的感受野呈高斯分布的特点,计算该锚框对应区域内各个类别的感受野权重;2)根据级联目标检测系统针对被作为训练样本的锚框的分类结果,以及该锚框对应的区域内每个类别的感受野权重,计算出该锚框对应的区域内每个类别的渐变式分类权重,将渐变式分类权重带入Softmax函数表达式,计算出该锚框属于每个类别的概率,再将该锚框属于每个类别的概率带入焦点损失表达式,计算出该锚框的分类结果的渐变式分类损失;3)根据链式求导法则,依次计算出级联目标检测系统针对被作为训练样本的锚框的分类结果的渐变式分类损失对该锚框属于分类结果对应的类别的概率的偏导数、该锚框属于分类结果对应的类别的概率对网络各个类别输出结果的偏导数以及各个类别输出结果对相关链路的偏导数,再将上述3个偏导数的乘积作为目标检测系统针对被作为训练样本的锚框的分类结果的渐变式分类损失在该链路权重处的梯度。2.如权利要求1所述方法,其特征在于:所述步骤1)中,被作为训练样本的锚框对应的区域内各个类别感受野权重的计算方法包括以下步骤:1.1)获取该锚框对应的区域内各个像素点所属的类别;1.2)计算该锚框对应的区域内各个像素点的感受野权重:采用离散二维高斯函数来赋予位于该锚框内部不同位置的像素点不同的感受野权重;1.3)计算该锚框对应的区域内各个类别的感受野权重:对于该锚框的对应区域,采用属于每个类别的像素点的感受野权重之和,作为该锚框的对应区域该类别c的感受野权重w_rfc;1.4)重复步骤1.1)至步骤1.3),直到获得所有被作为训练样本的锚框对应的区域内每个类别的感受野权重。3.如权利要求2所述方法,其特征在于:所述步骤1.1)中,对于目标检测算法中每个被作为训练样本的锚框对应的区域内各个像素点,如果该像素点位于第c个类别的第m个目标框oc,m对应的区域内部,则判定该像素点属于该目标框对应的类别c,如果该像素点位于多个不同类别的目标框内部的重叠区域,则判定该像素点属于面积最小的目标框对应的类别;如果该像素点未处于任何目标框对应区域内部,则判定该像素点属于背景类别;其中,c∈{1,…,C},C为类别总数;m为任意正整数。4.如权利要求2所述方法,其特征在于:所述步骤1.2)中,锚框对应区域内编号为(i,j)的像素点的感受野权重w_di,j为:其中,锚框宽度方向的方差σw和高度方向的方差σh的数值均等于1,A为使得锚框内部各个像素点的感受野权重相加之和等于1的常数,lw,i与lh,i分别为锚框内部编号为(i,j)的像素点与锚框中心点在宽度方向和高度方向上的归一化距离。5.如权利要求1所述方法,其特征在于:所述步骤2)中,被作为训练样本的锚框的渐变式分类损失计算方法包括以下步骤:2.1)计算级联目标检测系统针对被作为训练样本的锚框的各个类别的渐变式分类权重;2.2)计算级联目标检测系统针对被作为训练样本的锚框属于每个类别的概率:当级联目标检测系统针对被作为训练样本的锚框的各个类别的渐变式分类权重被计算出来后,将渐变式分类权重带入Softmax函数表达式,获得该锚框被级联目标检测系统的第t个阶段判断为属于类别c的概率pc,t;2.3)计算级联目标检测系统针对被作为训练样本的锚框的分类结果的渐变式分类损失:将步骤2.2)中计算出的被作为训练样本的锚框被级联目标检测系统的第t个阶段判断为属于类别c的概率pc,t带入焦点损失的表达式,求得级联目标检测系统第t个阶段针对该锚框的分类结果为类别c时的渐变式分类损失FLc,t:FLc,t=-(1-pc,t)γlnpc,t其中,γ为可调整的系数;2.4)重复步骤2.1)至2.3),直到获得级联目标检测系统各个阶段针对所有被作为训练样本的锚框各自的分类结果的渐变式分类损失。6.如权利要求5所述方法,其特...
【专利技术属性】
技术研发人员:刘阳,倪国栋,李兵,李洪研,沈志忠,朱昂,
申请(专利权)人:通号通信信息集团有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。