一种行人目标检测方法、装置及系统制造方法及图纸

技术编号:20746040 阅读:17 留言:0更新日期:2019-04-03 10:32
本发明专利技术公开了一种行人目标检测方法、装置及系统,本发明专利技术通过利用运动检测信息去除深度学习检测目标中的虚警目标,并利用运动像素优化目标边界,获得更加准确的目标定位信息。相比于只利用深度学习模型检测行人的方法,本发明专利技术方法由于有效的去除了虚警目标,所以大大提高了行人目标的检测准确率。

【技术实现步骤摘要】
一种行人目标检测方法、装置及系统
本专利技术涉及计算机
,特别是涉及一种行人目标检测方法、装置及系统。
技术介绍
随着计算机计算技术和存储技术的快速发展,视频信息占人们接受信息的比重越来越大,对视频的智能分析也越来越重要。其中视频目标检测是对视频分析的重要切入点,因此不管是在学术界还是在商业界,目标检测都是研究和应用的一个热点。传统的视频运动目标检测方法包括背景差法、帧差法、光流法,这类方法的主要原理是分析运动目标相对于背景图像的差异,确定运动目标所在的位置。深度学习是目前机器学习在实际应用中最成功的一种方法,在自然图像分类、通用目标检测、语义分割等视觉领域取得了突破性的成绩。将深度学习用于视频运动目标检测的方法,能够有效描述目标外观、结构、色彩等视觉特征,从而检测定位目标。而针对视频行人检测这个特定的应用,传统的视频运动目标检测方法仅仅利用目标运动信息并不能精确定位行人目标,尤其是目标之间有交叠、部分遮挡等情况下,无法区分不同的目标,检测准确率91.2%。基于深度学习的目标检测方法的局限性在于没有利用目标运动信息,导致与目标外观相似的虚警目标被误检,检测准确率92.3%。
技术实现思路
本专利技术提供了一种行人目标检测方法、装置及系统,以解决现有技术中视频行人检测不能精确定位行人目标的问题。本专利技术提供了一种行人目标检测方法,该方法包括:将原始图像I0输入预设的行人检测模型,得到行人检测结果集合P={<pk,Tk,xk,min,xk,max,yk,min,yk,max>,k=1,2,...,K};其中,K为当前检测到的行人目标数,pk为第k个目标Tk的检测置信度,xk,min,xk,max,yk,min,yk,max分别为Tk的上下左右边界像素位置;采用基于混合高斯模型的背景差算法对当前帧图像进行运动前景提取,得到的前景图I;将行人检测结果中第k个目标为Tk,在当前图像中对应的区域为(xk,min,xk,max,yk,min,yk,max),行人Tk的运动得分其中,Areak=(xk,max-xk,min+1)·(yk,max-yk,min+1),当Sk大于预定阈值,则判定Tk为正确检测到的行人目标,当Sk小于等于预定阈值,则判定Tk为虚警目标。优选地,所述行人检测模型为采用VOC和COCO数据库一起训练YOLOV3权重模型,目标类别数取class=1,迭代预定次数后得到的权重模型。优选地,对图像中坐标为(x,y)的点处混合高斯模型为M={<wi,Modeli>,i=1,2,...,Num},Num为混合高斯模型所包含的单高斯模型的数目,前景提取其中,I0为当前输入原始图像,θ为前景提取阈值。优选地,所述预定阈值为0.5。本专利技术第二方面提供了一种行人目标检测装置,该装置包括:处理单元,用于将原始图像I0输入预设的行人检测模型,得到行人检测结果集合P={<pk,Tk,xk,min,xk,max,yk,min,yk,max>,k=1,2,...,K};其中,K为当前检测到的行人目标数,pk为第k个目标Tk的检测置信度,xk,min,xk,max,yk,min,yk,max分别为Tk的上下左右边界像素位置;提取单元,用于采用基于混合高斯模型的背景差算法对当前帧图像进行运动前景提取,得到的前景图I;判断单元,用于将行人检测结果中第k个目标为Tk,在当前图像中对应的区域为(xk,min,xk,max,yk,min,yk,max),行人Tk的运动得分其中,Areak=(xk,max-xk,min+1)·(yk,max-yk,min+1),当Sk大于预定阈值,则判定Tk为正确检测到的行人目标,当Sk小于等于预定阈值,则判定Tk为虚警目标。优选地,所述行人检测模型为采用VOC和COCO数据库一起训练YOLOV3权重模型,目标类别数取class=1,迭代预定次数后得到的权重模型。优选地,所述提取单元,还用于对图像中坐标为(x,y)的点处混合高斯模型为M={<wi,Modeli>,i=1,2,...,Num},Num为混合高斯模型所包含的单高斯模型的数目,前景提取其中,I0为当前输入原始图像,θ为前景提取阈值。优选地,所述预定阈值为0.5。本专利技术第三方面提供了一种行人目标检测系统,该系统包括上述任一种所述的装置。本专利技术第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有信号映射的计算机程序,所述计算机程序被至少一个处理器执行时,以实现上述任一种所述的行人目标检测方法。本专利技术有益效果如下:本专利技术提供了一种融合运动检测信息和深度学习的视频行人检测方法,该方法利用运动检测信息去除深度学习检测目标中的虚警目标,并利用运动像素优化目标边界,获得更加准确的目标定位信息。相比于只利用深度学习模型检测行人的方法,本专利技术方法由于有效的去除了虚警目标,所以大大提高了行人目标的检测准确率。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是本专利技术实施例的一种行人目标检测方法的流程示意图;图2是本专利技术实施例的另一种行人目标检测方法的流程示意图;图3是本专利技术实施例的一种行人目标检测装置的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本专利技术第一实施例提供了一种行人目标检测方法,参见图1,该方法包括:S101、将原始图像I0输入预设的行人检测模型,得到行人检测结果集合P={<pk,Tk,xk,min,xk,max,yk,min,yk,max>,k=1,2,...,K};其中,K为当前检测到的行人目标数,pk为第k个目标Tk的检测置信度,xk,min,xk,max,yk,min,yk,max分别为Tk的上下左右边界像素位置;S102、采用基于混合高斯模型的背景差算法对当前帧图像进行运动前景提取,得到的前景图I;S103、将行人检测结果中第k个目标为Tk,在当前图像中对应的区域为(xk,min,xk,max,yk,min,yk,max),行人Tk的运动得分其中,Areak=(xk,max-xk,min+1)·(yk,max-yk,min+1),当Sk大于预定阈值,则判定Tk为正确检测到的行人目标,当Sk小于等于预定阈值,则判定Tk为虚警目标。具体实施时,本专利技术实施例设定所述预定阈值为0.5。本专利技术提出一种融合运动检测信息和深度学习的视频行人检测方法,该方法利用运动检测信息去除深度学习检测目标中的虚警目标,并利用运动像素优化目标边界,获得更加准确的目标定位信息。相比于只利用深度学习模型检测行人的方法,本专利技术方法由于有效的去除了虚警目标,所以大本文档来自技高网...

【技术保护点】
1.一种行人目标检测方法,其特征在于,包括:将原始图像I0输入预设的行人检测模型,得到行人检测结果集合P={<pk,Tk,xk,min,xk,max,yk,min,yk,max>,k=1,2,...,K};其中,K为当前检测到的行人目标数,pk为第k个目标Tk的检测置信度,xk,min,xk,max,yk,min,yk,max分别为Tk的上下左右边界像素位置;采用基于混合高斯模型的背景差算法对当前帧图像进行运动前景提取,得到的前景图I;将行人检测结果中第k个目标为Tk,在当前图像中对应的区域为(xk,min,xk,max,yk,min,yk,max),行人Tk的运动得分

【技术特征摘要】
1.一种行人目标检测方法,其特征在于,包括:将原始图像I0输入预设的行人检测模型,得到行人检测结果集合P={<pk,Tk,xk,min,xk,max,yk,min,yk,max>,k=1,2,...,K};其中,K为当前检测到的行人目标数,pk为第k个目标Tk的检测置信度,xk,min,xk,max,yk,min,yk,max分别为Tk的上下左右边界像素位置;采用基于混合高斯模型的背景差算法对当前帧图像进行运动前景提取,得到的前景图I;将行人检测结果中第k个目标为Tk,在当前图像中对应的区域为(xk,min,xk,max,yk,min,yk,max),行人Tk的运动得分其中,Areak=(xk,max-xk,min+1)·(yk,max-yk,min+1),当Sk大于预定阈值,则判定Tk为正确检测到的行人目标,当Sk小于等于预定阈值,则判定Tk为虚警目标。2.根据权利要求1所述的方法,其特征在于,所述行人检测模型为采用VOC和COCO数据库一起训练YOLOV3权重模型,目标类别数取class=1,迭代预定次数后得到的权重模型。3.根据权利要求1所述的方法,其特征在于,对图像中坐标为(x,y)的点处混合高斯模型为M={<wi,Modeli>,i=1,2,...,Num},Num为混合高斯模型所包含的单高斯模型的数目,前景提取其中,I0为当前输入原始图像,θ为前景提取阈值。4.根据权利要求1所述的方法,其特征在于,所述预定阈值为0.5。5.一种行人目标检测装置,其特征在于,包括:处理单元,用于将原始图像I0输入预设的行人检测模型,得到行人检测结果集合P={<pk,Tk,xk,min,xk,max...

【专利技术属性】
技术研发人员:仝小敏吉祥李鹏李俊毅仝茵
申请(专利权)人:中国电子科技集团公司电子科学研究院
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1