人头检测方法及装置制造方法及图纸

技术编号:21772589 阅读:58 留言:0更新日期:2019-08-03 21:48
本发明专利技术实施例提供一种人头检测方法及装置,所述方法包括:将待测图像输入至人头检测模型,获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度;基于所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度,采用IOU‑NMS算法对所述边界框集合进行后端处理,获得人头检测结果;其中,所述人头检测模型是根据图像样本以及所述图像样本对应的人头目标真值框进行训练后获得的。本发明专利技术实施例利用卷积神经网络和特定循环神经网络模型组成的人头检测模型对输入图像进行特征提取和解码回归,然后利用IOU‑NMS算法对边界框进行后端处理,可有效地提升复杂场景下人头检测的准确率。

Head Detection Method and Device

【技术实现步骤摘要】
人头检测方法及装置
本专利技术涉及目标检测
,尤其涉及一种人头检测方法及装置。
技术介绍
目标检测是要在图像中定位出目标物体出现的位置区域并判别出目标物体的分类。随着计算机视觉和模式识别技术的快速发展,以及硬件性能的不断提高,目标检测技术得到了广泛地应用。在学校、商场、医院等大型公共场所,人群的活动频繁而密集,在这些复杂场景下检测人物特征以获取信息对公共安全防控、公共设施合理调配、商业信息采集等都有重要的作用。人体检测选定的目标可以是完整的人体,也可以是完整的头部、人脸、四肢等局部人体特征,而检测目标的选择是影响检测结果的重要因素。因为人体在复杂场景下,很容易受到视角、光照、背景等因素的影响,并经常存在着不同程度的遮挡、形变、旋转、尺度变化等问题,这给人体检测与定位的准确性带来了很大的挑战。因此,选择人头这一遮挡可能性相对较小的人体特征作为检测目标,一定程度上降低了问题的复杂度。人头检测可应用于商场、学校等公共场所用于统计人数、分析人群密度以及后续的行人目标跟踪等等。如何提高复杂场景下人头检测的准确率是目前亟待解决的问题。现有基于深度卷积神经网络的目标检测方法按其算法核心思想可分为两类:基于RegionProposal的R-CNN、SPPNet、FastR-CNN、FasterR-CNN等方法,基于回归思想的YOLO系列、SSD等方法。基于回归思想的检测方法对于给定的输入图像,可直接在输入图像的多个位置上回归出目标边框以及目标类别,大大地加快了检测的速度;同时整个训练过程作为一个整体完成,相对于R-CNN分为几个阶段训练,基于回归思想方法的训练过程要简单得多。但是目前基于回归思想的方法对于存在不同程度的遮挡、形变、旋转、尺度变化等复杂场景下的人头检测的准确率不够高,不能满足应用要求。
技术实现思路
本专利技术实施例提供一种人头检测方法及装置,用以提高复杂场景下人头检测的准确率。第一方面,本专利技术实施例提供一种人头检测方法,包括:将待测图像输入至人头检测模型,获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度;基于所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度,采用IOU-NMS算法对所述边界框集合进行后端处理,获得人头检测结果;其中,所述人头检测模型包括卷积神经网络模型和特定循环神经网络模型OFLSTM;所述人头检测模型是根据图像样本以及所述图像样本对应的人头目标真值框进行训练后获得的。第二方面,本专利技术实施例提供一种人头检测装置,包括:检测模块,用于将待测图像输入至人头检测模型,获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度;处理模块,用于基于所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度,采用IOU-NMS算法对所述边界框集合进行后端处理,获得人头检测结果;其中,所述人头检测模型包括卷积神经网络模型和特定循环神经网络模型OFLSTM;所述人头检测模型是根据图像样本以及所述图像样本对应的人头目标真值框进行训练后获得的。第三方面,本专利技术实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的人头检测方法的步骤。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的人头检测方法的步骤。本专利技术实施例提供的人头检测方法及装置,利用卷积神经网络和特定循环神经网络模型OFLSTM组成的人头检测模型对输入图像进行特征提取和解码回归,获得输入图像的边界框集合以及每个边界框的分类置信度和IOU定位置信度,然后利用IOU-NMS算法对边界框进行后端处理,获得人头检测结果,检测方法简单有效,定位准确率高,可有效地提升复杂场景下人头检测的准确率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的人头检测方法的流程示意图;图2为本专利技术实施例提供的将待测图像输入至人头检测模型,获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度的步骤的流程示意图;图3为本专利技术实施例提供的OFLSTM单元的结构示意图;图4为本专利技术实施例提供的循环步数设置为3时所述特定循环神经网络模型OFLSTM的数据流图;图5为本专利技术实施例提供的训练人头检测模型的步骤的流程示意图;图6为本专利技术实施例提供的人头检测装置的结构示意图;图7为本专利技术实施例提供的电子设备的实体结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,为本专利技术实施例提供的人头检测方法的流程示意图,包括:步骤100、将待测图像输入至人头检测模型,获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度;其中,所述人头检测模型是根据图像样本以及所述图像样本对应的人头目标真值框进行训练后获得的。具体地,人头检测模型是以人头作为目标的一种目标检测模型,将待测图像输入到人头检测模型中,可以获得所述待测图像所对应的边界框(boundingbox)集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU(Intersection-over-Union,交并比)定位置信度。可以理解的是,将图像样本作为输入,将所述图像样本对应的人头目标真值框(ground-truthboundingboxes,预先在训练集图像样本中标出的人头大概范围)作为期望的输出,对所构建的人头检测模型进行训练。在本专利技术实施例中,人头检测模型包括卷积神经网络模型和特定循环神经网络模型OFLSTM。其中,所述卷积神经网络用于对待测图像进行特征提取,获得高层语义特征,所述特定循环神经网络模型OFLSTM用于对所述待测图像的高层语义特征进行解码回归。步骤101、基于所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度,采用IOU-NMS算法对所述边界框集合进行后端处理,获得人头检测结果;在目标检测中,通常利用非极大值抑制算法(NMS,nonmaximumsuppression)对生成的大量候选边界框进行后处理,去除冗余的候选边界框,得到最佳的人头检测框,作为人头检测结果,其本质思想是搜索局部最大值,抑制非极大值。传统的NMS算法在抑制重复检测时,分类分数通常被用作给候选边界框排名的指标,却缺失定位置信度,但是仅用分类得分作为依据判断一个边界框是否准确是不合理的,所以本专利技术实施例人头检测模型还预测了每个边界框的IOU定位置信度。在给边界框进行排序的同时考虑分类置信度和IOU定位置信度,本文档来自技高网
...

【技术保护点】
1.一种人头检测方法,其特征在于,包括:将待测图像输入至人头检测模型,获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度;基于所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度,采用IOU‑NMS算法对所述边界框集合进行后端处理,获得人头检测结果;其中,所述人头检测模型包括卷积神经网络模型和特定循环神经网络模型OFLSTM;所述人头检测模型是根据图像样本以及所述图像样本对应的人头目标真值框进行训练后获得的。

【技术特征摘要】
1.一种人头检测方法,其特征在于,包括:将待测图像输入至人头检测模型,获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度;基于所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度,采用IOU-NMS算法对所述边界框集合进行后端处理,获得人头检测结果;其中,所述人头检测模型包括卷积神经网络模型和特定循环神经网络模型OFLSTM;所述人头检测模型是根据图像样本以及所述图像样本对应的人头目标真值框进行训练后获得的。2.根据权利要求1所述的人头检测方法,其特征在于,所述将待测图像输入至人头检测模型,获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度的步骤,具体为:将待测图像输入至所述卷积神经网络模型中进行特征提取,获得所述待测图像对应的高层语义特征图;利用所述特定循环神经网络模型OFLSTM对所述待测图像的高层语义特征图进行解码回归,获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度。3.根据权利要求2所述的人头检测方法,其特征在于,所述卷积神经网络模型包括Darknet19模型的前二十三层,所述前二十三层包括十八个卷积层和五个最大池化层,并且在每个卷积层之后连接有群组归一化层和LeakyReLU激活层。4.根据权利要求2所述的人头检测方法,其特征在于,利用所述特定循环神经网络模型OFLSTM对所述待测图像的高层语义特征图进行解码回归,获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度的步骤,具体为:对所述待测图像的高层语义特征图进行维度调整,使得经过维度调整后的高层语义特征图符合OFLSTM单元的输入格式;根据预先设定的循环步数将所述经过维度调整后的高层语义特征图输入至OFLSTM单元中进行处理,对于OFLSTM单元的任一次循环:将所述经过维度调整后的高层语义特征图、OFLSTM单元上一次循环的输出以及OFLSTM单元的当前状态输入至OFLSTM单元,获取当前循环OFLSTM单元的输出;将所述当前循环OFLSTM单元的输出分别输入至三个不同的全连接层,获得所述待测图像在当前循环的边界框集合、所述当前循环的边界框集合中每个边界框的分类置信度和所述当前循环的边界框集合中每个边界框的IOU定位置信度;在达到预先设定的循环步数后,对多次循环得到的边界框集合进行维度调整后合并,对多次循环得到的边界框集合中每个边界框的分类置信度进行维度调整后合并,对多次循环得到的边界框集合中每个边界框的IOU定位置信度进行维度调整后合并;其中,所述OFLSTM单元为只有遗忘门且无偏置项的变体LSTM单元。5.根据权利要求1所述的人头检测方法,其特征在于,所述基于所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度,采用IOU-NMS算法对所述边界框集合进行后端处理,获得人头检测结果的步骤,具体为:将所述边界框集合中每个边界框对应的分类置信度与IOU定位置信度相乘,获得所述边界框集合中每个边界框对应的置信度乘积;根据所述边界框集合中每个边界框对应的置信度乘积,对所述边界框集合中的所有边界框进行排序,对置信度大于预设阈值的边界框集合采用非极大值抑制算法去除冗余框,将最终获得的边界框集合作为人头检测结果进行输出。6.根据权利要求1所述的人头检测...

【专利技术属性】
技术研发人员:张学阳李学军郑辉王雅
申请(专利权)人:精伦电子股份有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1