【技术实现步骤摘要】
行人检测方法和装置
本专利技术涉及计算机领域,更具体地涉及一种行人检测方法和装置。
技术介绍
在监控领域,行人检测具有非常重要的作用。目前的行人检测算法往往通过滑窗(sliding-window)方法来从待处理图像上提取多种不同尺度的窗口(每个窗口是一个矩形框,也可以称为行人框),并判断每个窗口中是否存在行人。但是这样的方法往往没有考虑场景的上下文(context)信息,依靠单一窗口判断是否有行人可能会得到很多假阳性(falsepositive)的检测结果。例如,场景中的树木、建筑物等物体可能跟行人的外观很像,这样就有可能发生误检测。
技术实现思路
考虑到上述问题而提出了本专利技术。本专利技术提供了一种行人检测方法和装置。根据本专利技术一方面,提供了一种行人检测方法。该方法包括:获取待处理图像;分析待处理图像的每个像素所属场景的场景信息;以及结合待处理图像的每个像素所属场景的场景信息检测待处理图像中的行人,以确定待处理图像中的行人所在的位置。示例性地,在分析待处理图像的每个像素所属场景的场景信息之前,行人检测方法还包括:提取待处理图像的特征;分析待处理图像的每个像素所属场景的场景信息包括:基于待处理图像的特征分析待处理图像的每个像素所属场景的场景信息;结合待处理图像的每个像素所属场景的场景信息检测待处理图像中的行人包括:结合待处理图像的特征和待处理图像的每个像素所属场景的场景信息检测待处理图像中的行人,以确定待处理图像中的行人所在的位置。示例性地,基于待处理图像的特征分析待处理图像的每个像素所属场景的场景信息包括:将待处理图像的特征输入全卷积网络,以获得与预定 ...
【技术保护点】
一种行人检测方法,包括:获取待处理图像;分析所述待处理图像的每个像素所属场景的场景信息;以及结合所述待处理图像的每个像素所属场景的场景信息检测所述待处理图像中的行人,以确定所述待处理图像中的行人所在的位置。
【技术特征摘要】
1.一种行人检测方法,包括:获取待处理图像;分析所述待处理图像的每个像素所属场景的场景信息;以及结合所述待处理图像的每个像素所属场景的场景信息检测所述待处理图像中的行人,以确定所述待处理图像中的行人所在的位置。2.如权利要求1所述的行人检测方法,其中,在所述分析所述待处理图像的每个像素所属场景的场景信息之前,所述行人检测方法还包括:提取所述待处理图像的特征;所述分析所述待处理图像的每个像素所属场景的场景信息包括:基于所述待处理图像的特征分析所述待处理图像的每个像素所属场景的场景信息;所述结合所述待处理图像的每个像素所属场景的场景信息检测所述待处理图像中的行人包括:结合所述待处理图像的特征和所述待处理图像的每个像素所属场景的场景信息检测所述待处理图像中的行人,以确定所述待处理图像中的行人所在的位置。3.如权利要求2所述的行人检测方法,其中,所述基于所述待处理图像的特征分析所述待处理图像的每个像素所属场景的场景信息包括:将所述待处理图像的特征输入全卷积网络,以获得与预定数目的场景类别一一对应的预定数目的场景特征图,其中,每个场景特征图与所述待处理图像大小一致,并且每个场景特征图的每个像素的像素值表示所述待处理图像的、与该像素位置一致的像素属于该场景特征图所对应的场景类别的场景置信度。4.如权利要求3所述的行人检测方法,其中,在所述将所述待处理图像的特征输入全卷积网络,以获得与预定数目的场景类别一一对应的预定数目的场景特征图之后,所述行人检测方法还包括:对于所述待处理图像的每个像素,从所述预定数目的场景特征图的、与该像素位置一致的像素的像素值中选择像素值最大的像素;以及确定该像素属于所述像素值最大的像素所属的场景特征图所对应的场景类别。5.如权利要求3所述的行人检测方法,其中,所述提取所述待处理图像的特征包括:将所述待处理图像输入卷积神经网络,以获得至少一个图像特征图,其中,所述至少一个图像特征图代表所述待处理图像的特征。6.如权利要求5所述的行人检测方法,其中,所述结合所述待处理图像的特征和所述待处理图像的每个像素所属场景的场景信息检测所述待处理图像中的行人包括:利用一个或多个卷积层对所述至少一个图像特征图和所述预定数目的场景特征图进行卷积,以获得行人特征图,其中,所述行人特征图与所述待处理图像大小一致,并且所述行人特征图的每个像素的像素值包括基于所述待处理图像的、与该像素位置一致的像素预测出的行人框的顶点坐标和该行人框属于行人的行人置信度。7.如权利要求6所述的行人检测方法,其中,所述利用一个或多个卷积层对所述至少一个图像特征图和所述预定数目的场景特征图进行卷积包括:对所述至少一个图像特征图和所述预定数目的场景特征图进行拼接;以及将拼接后的特征图输入所述一个或多个卷积层中的在先卷积层,以由所述一个或多个卷积层处理。8.如权利要求6所述的行人检测方法,其中,所述结合所述待处理图像的特征和所述待处理图像的每个像素所属场景的场景信息检测所述待处理图像中的行人还包括:对包含同一行人的多个行人框进行筛选,以保留所述包含同一行人的行人框之一。9.如权利要求6所述的行人检测方法,其中,所述结合所述待处理图像的特征和所述待处理图像的每个像素所属场景的场景信息检测所述待处理图像中的行人还包括:基于所述待处理图像的每个像素所属的场景类别过滤不属于行人的行人框。10.如权利要求5所述的行人检测方法,其中,所述行人检测方法还包括:获取训练图像和标注数据,其中,所述标注数据包括所述训练图像中的每个行人所对应的行人框和所述训练图像的每个像素所属的场景类别;以所述训练图像中的每个行人所对应的行人框作为利用所述卷积神经网络和所述全卷积网络对所述训练图像进行处理所获得的行人框的目标值构建第一损失函数,并以所述训练图像中的每个像素所属的场景类别作为利用所述卷积神经网络和所述全卷积网络对所述训练图像进行...
【专利技术属性】
技术研发人员:俞刚,彭超,
申请(专利权)人:北京旷视科技有限公司,北京小孔科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。