【技术实现步骤摘要】
一种基于多任务损失函数的目标检测方法及系统
本专利技术涉及目标检测
,特别是涉及一种基于多任务损失函数的目标检测方法及系统。
技术介绍
作为安防领域的重要防护措施之一,可见光视频监控被广泛应用于公安、银行、军工、交通、酒店等重要场所。近年来,随着计算机视觉技术的发展和计算机运算性能的提升,基于深度学习的目标检测技术被越来越多地应用于视频监控中。该技术可在无需人员参与的情况下,通过分析和提取视频图像中的视觉信息,对视频中的感兴趣目标进行自动分类和定位,从而在快速获取目标信息的同时,节约大量人力物力,具有较强的实用性。然而相比常规静态图像的目标检测,基于视频图像的目标检测存在更大的挑战。动态拍摄场景下的目标视觉轮廓较模糊,难以准确定位,而且受到拍摄角度和目标姿态变化的影响,目标外形往往存在较大的类间相似性和类内差异性,导致其分类难度较高。因此,视频图像目标检测对深度神经网络的定位和分类能力均提出了较高要求,这也使得该研究领域受到越来越多研究人员的关注。在深度神经网络中,损失函数通过计算模型预测值与真实值的差异来反映 ...
【技术保护点】
1.一种基于多任务损失函数的目标检测方法,其特征在于,包括:/n采集视频图像数据集;/n构建基于特征金字塔网络的Faster R-CNN网络结构;/n为所述基于特征金字塔网络的Faster R-CNN网络结构构建多任务损失函数,所述多任务损失函数包括回归损失函数和分类损失函数,所述回归损失函数为Balanced L1 Loss损失函数,所述分类损失函数为增强边缘余弦损失函数;/n采用所述视频图像数据集对所述基于特征金字塔网络的Faster R-CNN网络进行训练,获得目标检测模型;/n利用所述目标检测模型对待检测图像进行目标检测;/n所述多任务损失函数表示为:/n
【技术特征摘要】
1.一种基于多任务损失函数的目标检测方法,其特征在于,包括:
采集视频图像数据集;
构建基于特征金字塔网络的FasterR-CNN网络结构;
为所述基于特征金字塔网络的FasterR-CNN网络结构构建多任务损失函数,所述多任务损失函数包括回归损失函数和分类损失函数,所述回归损失函数为BalancedL1Loss损失函数,所述分类损失函数为增强边缘余弦损失函数;
采用所述视频图像数据集对所述基于特征金字塔网络的FasterR-CNN网络进行训练,获得目标检测模型;
利用所述目标检测模型对待检测图像进行目标检测;
所述多任务损失函数表示为:
;
其中,L表示所述多任务损失函数,Llmc表示所述增强边缘余弦损失函数,LbalancedL1表示所述BalancedL1Loss损失函数;u表示目标样本的特征向量,q表示余弦边界,N表示第一样本个数,n表示类别总数,r表示不属于样本真实类别的类别,j表示样本真实类别,θr,u表示u和类别r的夹角,θj,u表示u和类别j的夹角,R表示设定值;
;
x表示预测框的中心横坐标,y表示预测框的中心纵坐标,w表示预测框的宽度,h表示预测框的高度,N*表示第二样本个数,ai表示位置参数i的目标检测模型的预测值;bi表示位置参数i的目标检测模型的真实值;β为比例参数,µ为第一调节参数,λ为第二调节参数,Ψ为权重值,C表示常数。
2.根据权利要求1所述的基于多任务损失函数的目标检测方法,其特征在于,所述基于特征金字塔网络的FasterRCNN网络包括骨干网络、特征金字塔网络、区域生成网络、ROI池化层和检测头,所述骨干网络为ResNet101,所述骨干网络包括五个卷积模块,五个所述卷积模块分别用于输出特征图C_1、特征图C_2、特征图C_3、特征图C_4和特征图C_5,特征图C_1、特征图C_2、特征图C_3、特征图C_4和特征图C_5的尺寸依次减小;特征金字塔网络用于将特征图C_2、特征图C_3、特征图C_4和特征图C_5均经过一个卷积核为1*1的卷积层,获得特征图P_2、特征图P_3、特征图P_4和特征图P_5,所述特征图P_5进行0.5倍下采样获得特征图P_6,所述特征图P_5进行2倍上采样后与所述特征图P_4按元素相加后经过一个卷积核为3*3的卷积层获得特征图P4,所述特征图P_4进行2倍上采样后与所述特征图P_3按元素相加后经过一个卷积核为3*3的卷积层获得特征图P3,所述特征图P_3进行2倍上采样后与所述特征图P_2按元素相加后经过一个卷积核为3*3的卷积层获得特征图P2;所述特征图P_6、所述特征图P_5、所述特征图P4、所述特征图P3、所述特征图P2均输入所述区域生成网络,所述区域生成网络连接所述ROI池化层,所述ROI池化层连接所述检测头,所述检测头用于输出检测结果。
3.根据权利要求2所述的基于多任务损失函数的目标检测方法,其特征在于,所述检测头包括回归支路和分类支路;所述分类支路用于确定检测目标的类别,所述回归支路用于确定检测目标的位置信息。
4.根据权利要求1所述的基于多任务损失函数的目标检测方法,其特征在于,所述采集视频图像数据集,具体包括:
通过可见光摄像头采集来往人流与车流的视频数据;
将所述视频数据转化为一组连续帧的图片;
采用Labelme软件对各所述图片中的各类目标进行类别标注,获得可扩展标记语言格式的标注文件,所述标注文件和与所述标注文件对应的图片构成视频图像数据集。
5.一种基于多任务损失函数的目标检测系统,其特征在于,包括:
...
【专利技术属性】
技术研发人员:文彬,严凡,周鹏兵,杨涛,
申请(专利权)人:北京电信易通信息技术股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。