一种基于深度神经网络的迭代定位式人脸检测方法技术

技术编号：17442383 阅读：33 留言：0更新日期：2018-03-10 15:11

本发明专利技术公开了一种基于深度神经网络的迭代定位式人脸检测方法，包括如下步骤：基于AFLW公共图像数据集，提取其中的区域图像块作为训练集的输入并进行预处理；定义人脸候选框提取模型P‑Net和人脸偏移微调模型A‑Net，使用上述训练集训练该模型；对上述已训练模型P‑Net采用全卷积化策略，以获得对样本的全局检测结果矩阵；测试过程中将图片输入模型P‑Net获取人脸候选框，再通过模型A‑Net迭代式微调人脸候选框位置，配合极大值抑制方法获得最终结果。本发明专利技术方法用于在复杂环境中，利用计算机自动检测人脸，且具有准确性高、识别速度快、性能稳定等优点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度神经网络的迭代定位式人脸检测方法
本专利技术涉及基于图像的人脸检测
，具体涉及一种基于深度神经网络的迭代定位式人脸检测方法。
技术介绍
一、人脸检测的定义人脸检测是指，给定任意一张图像，利用计算机自动检测出其中所有的人脸(如果存在)，并返回这些人脸的位置。二、人脸检测的重要性人脸是信息量很大的视觉模式，其所反映出的视觉信息，在人们的生活、工作中有着重要的意义和作用。在信息自动化的今天，人脸识别在社会生活中已经得到广泛应用，在这里面，人脸检测是一个关键环节，如果人脸检测算法的效果不好，势必会影响到后续识别算法的效果。除此之外，基于图像的年龄识别，性别识别，情绪识别等识别算法，同样需要人脸检测算法来作为基础环节。这些技术应用的广泛应用，将人脸检测算法的重要性提升到了新的高度。三、人脸检测的技术发展对人脸检测的研究可以追溯到20世纪70年代，人脸检测早期的研究主要致力于模板匹配、子空间方法、变形模板匹配等。这些早期的人脸检测方法往往针对简单无变化背景下的正面人脸检测，对于复杂环境下的人脸，并不具备很好的检测效果。20世纪90年代到21世纪初，基于级联结构的人脸检测方法获得很大发展，其中Viola和Jones在Adaboost算法的基础上，使用Haar-like小波特征和积分图方法进行人脸检测，该方法在检测准确性和实时性上获得了很大提升，但同样无法处理复杂场景下的人脸检测。近年来，随着深度学习的快速发展，基于深度学习的人脸检测算法获得了长足的发展，这些方法包括：吴素雯,战荫伟.基于选择性搜索和卷积神经网络的人脸检测,2016年9月28日[J].计...
一种基于深度神经网络的迭代定位式人脸检测方法

【技术保护点】
一种基于深度神经网络的迭代定位式人脸检测方法，其特征在于，所述的人脸检测方法包括如下步骤：S1、定义人脸候选框提取模型P‑Net和人脸偏移微调模型A‑Net；S2、基于AFLW公共图像数据集提取训练模型P‑Net和模型A‑Net所需要的数据以及相应标签；S3、使用上一个步骤所获得的数据，基于经典卷积神经网络微调训练模型P‑Net和模型A‑Net；S4、对上述已训练的模型P‑Net采用全卷积化策略，以获得对输入图片的全局检测结果矩阵；S5、对于一张待测试图片，将多尺度形式下的图片输入模型P‑Net获得多个尺度的检测结果矩阵，通过这些矩阵以及窄化非极大值抑制算法获取候选人脸框；S6、再根据人脸位置判别条件，将候选人脸框迭代式输入至模型A‑Net进行微调，直到满足判别条件；S7、使用窄化非极大值抑制算法去除重复的人脸候选框，并输出最后检测结果。

【技术特征摘要】
1.一种基于深度神经网络的迭代定位式人脸检测方法，其特征在于，所述的人脸检测方法包括如下步骤：S1、定义人脸候选框提取模型P-Net和人脸偏移微调模型A-Net；S2、基于AFLW公共图像数据集提取训练模型P-Net和模型A-Net所需要的数据以及相应标签；S3、使用上一个步骤所获得的数据，基于经典卷积神经网络微调训练模型P-Net和模型A-Net；S4、对上述已训练的模型P-Net采用全卷积化策略，以获得对输入图片的全局检测结果矩阵；S5、对于一张待测试图片，将多尺度形式下的图片输入模型P-Net获得多个尺度的检测结果矩阵，通过这些矩阵以及窄化非极大值抑制算法获取候选人脸框；S6、再根据人脸位置判别条件，将候选人脸框迭代式输入至模型A-Net进行微调，直到满足判别条件；S7、使用窄化非极大值抑制算法去除重复的人脸候选框，并输出最后检测结果。2.根据权利要求1所述的一种基于深度神经网络的迭代定位式人脸检测方法，其特征在于，所述的步骤S1中的人脸偏移微调模型A-Net中，设定该模型为N类分类模型，这N类人脸偏移模式用于评估一个人脸候选框其对于人脸真实框的偏移程度，人脸偏移模式采用横轴、纵轴、缩放率三个因素来衡量，采用设定的设定如下：定义偏移模式集合：其中，xn代表该候选框在x轴上相对候选框宽度本身的偏移率，yn代表该候选框在y轴上相对候选框长度本身的偏移率，sn代表该候选框相对本身长度，应该缩放的比率，N代表偏移模式类别数，n为类别下标。3.根据权利要求2所述的一种基于深度神经网络的迭代定位式人脸检测方法，其特征在于，设置偏移模式类别数N＝45，n为类别下标,对xn，yn，sn分别赋值如下，可以获得5x3x3＝45个类别：4.根据权利要求1所述的一种基于深度神经网络的迭代定位式人脸检测方法，其特征在于，所述的步骤S4中的全卷积化策略，即将全连接层的参数保存，接着用同样尺寸的卷积层替代全连接层，并将之前保存的全连接层参数赋值给新的卷积层。5.根据权利要求1所述的一种基于深度神经网络的迭代定位式人脸检测方法，其特征在于，所述的步骤S5中的检测结果矩阵，其每个点代表原图片中某个227*227像素大小正方形区域的检测结果,通过将其还原至原图中的候选框，再根据候选框的重合情况使用窄化非极大值抑制算法获得人脸候选框。6.根据权利要求1所述的一种基于深度神经网络的迭代定位式人脸检测方法，其特征在于，所述的步骤S5中的窄化非极大值抑制，为一种对象形状定制化的极大值抑制算法，其对人脸这种具有不同长宽比的矩形候选框具有更好的效果,具体如下：在对多个部分重合的候选框进行非极大值抑制之前，对原始的正方形候选框进行中心窄化，窄化公式为其中...

【专利技术属性】
技术研发人员：文贵华，罗达志，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人