基于级联深度卷积神经网络的人脸检测方法技术

技术编号：20843621 阅读：22 留言：0更新日期：2019-04-13 08:51

本发明专利技术公开了一种基于级联深度卷积神经网络的人脸检测方法，包括：建立n级深度卷积网络；对训练样本填充后进行卷积运算；将特征图中的部分或全部特征图作为下一层卷积层的输入，进行卷积运算；重复上一步骤直至到第n+1层卷积层；将第n+1层卷积层输出的特征图串行化得到高维向量，将高维向量与全连接层的节点进行全连接；输出人脸框坐标和人脸质量评价得分；获取人脸检测损失函数、图像质量评价损失函数及总损失函数；获取训练样本的损失函数，进行训练样本权值的更新；训练出级联深度卷积神经网络。本发明专利技术能同时解决人脸检测和人脸图像质量评价的问题、在提高处理速度的同时还能提高性能。

全部详细技术资料下载

【技术实现步骤摘要】
基于级联深度卷积神经网络的人脸检测方法
本专利技术涉及人脸检测领域，特别涉及一种基于级联深度卷积神经网络的人脸检测方法。
技术介绍
人脸检测(FaceDetection)是指在输入图像中，采用一定的策略对其进行搜索，确定其中是否含有人脸，如果有则返回各个人脸的位置及大小的过程。。人脸检测是人脸识别的基础，是人脸识别的先行步骤。人脸检阶段检测出的人脸图像质量好坏直接影响到人脸识别的精度。传统的人脸识别过程中，人脸检测和人脸图像质量评价是分两个阶段任务完成的，先检测出人脸图像，然后对检测出的人脸图像进行质量评价。这种方法有两个不足之处，一是需要消耗更多的处理时间，而在许多图像实时处理中，处理时间是一个很关键的指标。二是人脸检测的过程本身就需要用到图像质量作为判断依据，两种之间存在相关性。将这两个任务分开处理，会割裂两者之间的相关性。人脸检测方法可分成四大类：1)基于知识的方法。这种方法将研究人员对人脸的知识编码成识别规则。例如图像中的人脸，通常具有互相对称的两只眼睛、一个鼻子和一张嘴吧。特征之间的相互关系可以通过它们之间的距离和位置关系来描述。这种方法的问题是很难将人的知识转换为明确定义的规则。如果规则过于详细，则会导致低的识别率，反之，如果规则太通用，则会导致高的错检率。2)特征不变量方法。这种方法的依据是人可以容易地识别出不同姿态、角度、光照条件下的人脸，因此可以认为图像中存在不随姿态、角度、光照条件改变的特征不变量。该方法先提取出诸如眉毛、眼睛、鼻子、嘴巴等面部特征，然后建立统计模型描述特征之间的关系以证实人脸的存在。该方法的问题是当图像中存在光照、噪声...

【技术保护点】
1.一种基于级联深度卷积神经网络的人脸检测方法，其特征在于，包括如下步骤：A)建立n级深度卷积网络；所述n级深度卷积网络包括n个卷积层、一个全连接层、一个人脸框输出层和一个人脸质量评价输出层，每个所述卷积层中含有多个正方形卷积核和长方形卷积核，所述人脸框输出层设有多个节点，所述人脸质量评价输出层设有多个节点，所述n为整数且n≥1；B)选取若干个输入图像作为训练样本，对当前训练样本的边缘处进行行数和列数的填充，得到填充图像，并将所述填充图像分别与第一层所述卷积层中的每个卷积核进行卷积运算，得到多个特征图；C)将所述特征图中的部分或全部特征图作为下一层所述卷积层的输入，并将其分别与下一层所述卷积层中的每个卷积核进行卷积运算，得到多个对应的特征图；D)重复上述步骤C)直至到第n+1层所述卷积层；E)将第n+1层所述卷积层输出的特征图串行化得到高维向量，将所述高维向量与所述全连接层的节点进行全连接；F)通过所述人脸框输出层输出人脸框坐标，通过所述人脸质量评价输出层输出人脸质量评价得分；G)根据所述人脸框坐标，计算出包围框坐标偏移量，得到人脸检测损失函数；H)用Softmax loss函数来表示...

【技术特征摘要】
1.一种基于级联深度卷积神经网络的人脸检测方法，其特征在于，包括如下步骤：A)建立n级深度卷积网络；所述n级深度卷积网络包括n个卷积层、一个全连接层、一个人脸框输出层和一个人脸质量评价输出层，每个所述卷积层中含有多个正方形卷积核和长方形卷积核，所述人脸框输出层设有多个节点，所述人脸质量评价输出层设有多个节点，所述n为整数且n≥1；B)选取若干个输入图像作为训练样本，对当前训练样本的边缘处进行行数和列数的填充，得到填充图像，并将所述填充图像分别与第一层所述卷积层中的每个卷积核进行卷积运算，得到多个特征图；C)将所述特征图中的部分或全部特征图作为下一层所述卷积层的输入，并将其分别与下一层所述卷积层中的每个卷积核进行卷积运算，得到多个对应的特征图；D)重复上述步骤C)直至到第n+1层所述卷积层；E)将第n+1层所述卷积层输出的特征图串行化得到高维向量，将所述高维向量与所述全连接层的节点进行全连接；F)通过所述人脸框输出层输出人脸框坐标，通过所述人脸质量评价输出层输出人脸质量评价得分；G)根据所述人脸框坐标，计算出包围框坐标偏移量，得到人脸检测损失函数；H)用Softmaxloss函数来表示图像质量评价损失函数；I)对所述人脸检测损失函数和图像质量评价损失函数进行加权叠加后得到当前所述训练样本的损失函数；J)对每个训练样本的损失函数进行求和，得到总损失函数；K)当其中一级深度卷积网络训练结束后，用训练好的深度卷积网络计算出每个训练样本的损失函数，将损失函数大的训练样本的权值进行增大，将损失函数小的训练样本的权值进行减小，完成对每个所述训练样本的权值的更新；L)通过所述步骤A)至步骤K)的学习方式，将多级深度卷积网络串起来训练出级联深度卷积神经网络，采用所述级联深度卷积神经网络进行人脸检测，去除非人脸窗口。2.根据权利要求1所述的基于级联深度卷积神经网络的人脸检测方法，其特征在于，在所述第n级深度卷积网络中，所述全连接层的节点数为64x2(n-1)，从所述全连接层往左算起，第m个卷积层的卷积核的大小分别为(1+2m)×(1+2m)、(3+2m)×(1+2m)和(1+2m)×(3+2m)，通道数均为16×2(n-m)，所述m为整数且0<m<n+2。3.根据权利要求2所述的基于级联深度卷积神经网络的人脸检测方法，其特征在于，在所述步骤B)中，令所述当前训练样本的大小为Iy×Ix，卷积核的大小为ky×kx，在所述当前训练样本的边...

【专利技术属性】
技术研发人员：温峻峰，江志伟，李鑫，杜海江，夏欢，谢巍，张浪文，翁冠碧，
申请(专利权)人：中科天网广东科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人