人头检测方法及装置制造方法及图纸

技术编号：21772589 阅读：58 留言：0更新日期：2019-08-03 21:48

本发明专利技术实施例提供一种人头检测方法及装置，所述方法包括：将待测图像输入至人头检测模型，获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度；基于所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度，采用IOU‑NMS算法对所述边界框集合进行后端处理，获得人头检测结果；其中，所述人头检测模型是根据图像样本以及所述图像样本对应的人头目标真值框进行训练后获得的。本发明专利技术实施例利用卷积神经网络和特定循环神经网络模型组成的人头检测模型对输入图像进行特征提取和解码回归，然后利用IOU‑NMS算法对边界框进行后端处理，可有效地提升复杂场景下人头检测的准确率。

Head Detection Method and Device

全部详细技术资料下载

【技术实现步骤摘要】
人头检测方法及装置
本专利技术涉及目标检测
，尤其涉及一种人头检测方法及装置。
技术介绍
目标检测是要在图像中定位出目标物体出现的位置区域并判别出目标物体的分类。随着计算机视觉和模式识别技术的快速发展，以及硬件性能的不断提高，目标检测技术得到了广泛地应用。在学校、商场、医院等大型公共场所，人群的活动频繁而密集，在这些复杂场景下检测人物特征以获取信息对公共安全防控、公共设施合理调配、商业信息采集等都有重要的作用。人体检测选定的目标可以是完整的人体，也可以是完整的头部、人脸、四肢等局部人体特征，而检测目标的选择是影响检测结果的重要因素。因为人体在复杂场景下，很容易受到视角、光照、背景等因素的影响，并经常存在着不同程度的遮挡、形变、旋转、尺度变化等问题，这给人体检测与定位的准确性带来了很大的挑战。因此，选择人头这一遮挡可能性相对较小的人体特征作为检测目标，一定程度上降低了问题的复杂度。人头检测可应用于商场、学校等公共场所用于统计人数、分析人群密度以及后续的行人目标跟踪等等。如何提高复杂场景下人头检测的准确率是目前亟待解决的问题。现有基于深度卷积神经网络的目标检测方法按其算法核心思想可分为两类：基于RegionProposal的R-CNN、SPPNet、FastR-CNN、FasterR-CNN等方法，基于回归思想的YOLO系列、SSD等方法。基于回归思想的检测方法对于给定的输入图像，可直接在输入图像的多个位置上回归出目标边框以及目标类别，大大地加快了检测的速度；同时整个训练过程作为一个整体完成，相对于R-CNN分为几个阶段训练，基于回归思想方法的训练过程要...

【技术保护点】
1.一种人头检测方法，其特征在于，包括：将待测图像输入至人头检测模型，获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度；基于所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度，采用IOU‑NMS算法对所述边界框集合进行后端处理，获得人头检测结果；其中，所述人头检测模型包括卷积神经网络模型和特定循环神经网络模型OFLSTM；所述人头检测模型是根据图像样本以及所述图像样本对应的人头目标真值框进行训练后获得的。

【技术特征摘要】
1.一种人头检测方法，其特征在于，包括：将待测图像输入至人头检测模型，获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度；基于所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度，采用IOU-NMS算法对所述边界框集合进行后端处理，获得人头检测结果；其中，所述人头检测模型包括卷积神经网络模型和特定循环神经网络模型OFLSTM；所述人头检测模型是根据图像样本以及所述图像样本对应的人头目标真值框进行训练后获得的。2.根据权利要求1所述的人头检测方法，其特征在于，所述将待测图像输入至人头检测模型，获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度的步骤，具体为：将待测图像输入至所述卷积神经网络模型中进行特征提取，获得所述待测图像对应的高层语义特征图；利用所述特定循环神经网络模型OFLSTM对所述待测图像的高层语义特征图进行解码回归，获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度。3.根据权利要求2所述的人头检测方法，其特征在于，所述卷积神经网络模型包括Darknet19模型的前二十三层，所述前二十三层包括十八个卷积层和五个最大池化层，并且在每个卷积层之后连接有群组归一化层和LeakyReLU激活层。4.根据权利要求2所述的人头检测方法，其特征在于，利用所述特定循环神经网络模型OFLSTM对所述待测图像的高层语义特征图进行解码回归，获得边界框集合、所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度的步骤，具体为：对所述待测图像的高层语义特征图进行维度调整，使得经过维度调整后的高层语义特征图符合OFLSTM单元的输入格式；根据预先设定的循环步数将所述经过维度调整后的高层语义特征图输入至OFLSTM单元中进行处理，对于OFLSTM单元的任一次循环：将所述经过维度调整后的高层语义特征图、OFLSTM单元上一次循环的输出以及OFLSTM单元的当前状态输入至OFLSTM单元，获取当前循环OFLSTM单元的输出；将所述当前循环OFLSTM单元的输出分别输入至三个不同的全连接层，获得所述待测图像在当前循环的边界框集合、所述当前循环的边界框集合中每个边界框的分类置信度和所述当前循环的边界框集合中每个边界框的IOU定位置信度；在达到预先设定的循环步数后，对多次循环得到的边界框集合进行维度调整后合并，对多次循环得到的边界框集合中每个边界框的分类置信度进行维度调整后合并，对多次循环得到的边界框集合中每个边界框的IOU定位置信度进行维度调整后合并；其中，所述OFLSTM单元为只有遗忘门且无偏置项的变体LSTM单元。5.根据权利要求1所述的人头检测方法，其特征在于，所述基于所述边界框集合中每个边界框的分类置信度和每个边界框的IOU定位置信度，采用IOU-NMS算法对所述边界框集合进行后端处理，获得人头检测结果的步骤，具体为：将所述边界框集合中每个边界框对应的分类置信度与IOU定位置信度相乘，获得所述边界框集合中每个边界框对应的置信度乘积；根据所述边界框集合中每个边界框对应的置信度乘积，对所述边界框集合中的所有边界框进行排序，对置信度大于预设阈值的边界框集合采用非极大值抑制算法去除冗余框，将最终获得的边界框集合作为人头检测结果进行输出。6.根据权利要求1所述的人头检测...

【专利技术属性】
技术研发人员：张学阳，李学军，郑辉，王雅，
申请(专利权)人：精伦电子股份有限公司，
类型：发明
国别省市：湖北,42

全部详细技术资料下载我是这个专利的主人