基于神经网络的人脸检测模型的训练、人脸检测方法及系统技术方案

技术编号:14783380 阅读:94 留言:0更新日期:2017-03-10 04:29
本发明专利技术提供一种基于神经网络的人脸检测模型的训练、人脸检测方法及系统,训练方法:根据预测人脸框相对于默认人脸框的偏置信息,及真实人脸框相对于默认人脸框的偏置信息,计算预测人脸框偏置网络层的损失函数;根据默认人脸框的置信度,计算预测人脸框置信度网络层的损失函数;计算两个损失函数的误差并将误差反馈到神经网络中对神经网络中的权重进行调整;重复迭代训练直至收敛得到人脸检测模型,从而使得预测人脸框更加精确的包含人脸。检测方法:将待测人脸图像输入到训练好的人脸检测模型中输出偏置信息及置信度;根据偏置信息计算对应的预测人脸框;选取大于预设的置信度阈值的置信度或者最高置信度所对应的预测人脸框作为人脸检测结果。

【技术实现步骤摘要】

本专利技术涉及图像处理
,特别是涉及一种基于神经网络的人脸检测模型的训练、人脸检测方法及系统
技术介绍
人脸检测其主要任务是判断给定的人脸图像上是否存在人脸,如果存在人脸,则给出人脸所处的位置和大小。人脸检测的通常采用的流程主要包含以下三步:(1)从图像上选择一个矩形区域作为一个观察窗口;(2)对观察窗口提取特征,用于描述其包含的内容;(3)进行分类判别,判断这个窗口是否包含一张人脸。通过不断的重复上述三个步骤,直到遍历完人脸图像上所有的观察窗口。如果有观察窗口被判别为包含人脸,则该窗口的位置和大小即可为检测到的人脸的位置和大小;反之,如果所有窗口都不包含人脸,则认为给定的人脸图像不存在人脸。目前普遍采用的人脸检测器都是基于PaulViola和MichaelJones于2001年设计Viola-Jones人脸检测器;首先,使用Haar特征构建积分图从而实现特征的快速计算;其次,使用有效的特征分类器方法,例如,AdaBoost算法;最后,通过级联的方式对窗口进行由粗到细的判别。由于人脸的非刚性的属性结构,加上外部环境复杂多变,因此人脸检测技术存在误检高,人脸检出率低等问题。针对这一问题,后续大量的工作对Viola-Jones人脸检测器进行了改进,例如,选用描述能力更强的特征(LBP,HOG),改进分类器算法以及级联结构等,使得人脸检测的性能有所改善。近年来,随着深度学习的发展,也逐渐出现了一些基于深度神经网络的人脸检测方法,例如,CascadeCNN,Faceness,FasterRCNN等,相比传统的人脸检测方法,深度神经网络提取的特征具有更强的鲁棒性和描述能力,因此具有较高的检测率和较低的误检。虽然目前人脸检测器已经取得了长足的进展,但仍存在以下几个方面的问题:(1)目前大部分人脸检测器都采用滑动窗口方式进行选择观察窗口,因此遍历完一张人脸图像,需要对大量的观察窗口进行计算判别,因此计算量较大;并且针对人脸图像中不同大小的人脸,需要构建图像金字塔,或者采用不同尺度的观察窗,人脸检测速度较慢。(2)大部分的人脸检测算法都步骤较多,每个步骤都相对独立,其中任何一个步骤出现问题,都会影响最终的人脸检测结果。(3)基于深度学习的人脸检测方法,虽然效果较好,但需要对输入人脸图像缩放到固定大小,造成图像中的人脸拉伸、扭曲、变形等,影响最终的人脸检测结果。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种基于神经网络的人脸检测模型的训练、人脸检测方法及系统,能够实现人脸的多尺度检测。为实现上述目的及其他相关目的,本专利技术提供一种基于神经网络的人脸检测模型的训练方法,所述神经网络包括:人脸检测的网络层、预测人脸框偏置的网络层及预测人脸框置信度的网络层;其中,所述人脸检测的网络层是根据所述神经网络中不同网络层对应训练集中的人脸图像的感受野选取的,所述人脸检测的网络层中的每个胞元绑定六个默认人脸框,所述默认人脸框是根据对应的人脸检测的网络层规模设置的;每层人脸检测的网络层连接一层预测人脸框偏置的网络层及一层预测人脸框置信度的网络层;所述方法还包括:接收到模型训练指令时,将所述训练集中的人脸图像输入到所述神经网络中进行训练;通过预测人脸框偏置的网络层计算出预测人脸框相对于对应的默认人脸框的偏置信息,以及计算出真实人脸框相对于对应的默认人脸框的偏置信息;并通过预测人脸框置信度的网络层计算出每个默认人脸框包含人脸的置信度;根据所述预测人脸框相对于对应的默认人脸框的偏置信息,以及所述真实人脸框相对于对应的默认人脸框的偏置信息,计算预测人脸框偏置的网络层的损失函数;并根据所述默认人脸框包含人脸的置信度,计算预测人脸框置信度的网络层的损失函数;计算所述预测人脸框偏置的网络层的损失函数与所述预测人脸框置信度的网络层的损失函数的误差,并将所述误差通过反向传播反馈到所述神经网络中,根据所述误差更新所述神经网络的网络权重参数以及根据更新后的网络权重参数调整所述预测人脸框;重复迭代训练直至调整后的预测人脸框与真实人脸框的误差在预设的误差范围之内,输出人脸检测模型。优选地,所述通过预测人脸框偏置的网络层计算出预测人脸框相对于对应的默认人脸框的偏置信息,包括:按照以下公式计算出预测人脸框相对于对应的默认人脸框的偏置信息:tx=(x-xa)/wa,ty=(y-ya)/hatw=log(w/wa),th=log(h/ha)其中,(x,y,w,h)为预测人脸框的中心点坐标、宽和高;(xa,ya,wa,ha)为默认人脸框的中心点坐标、宽和高;(tx,ty,tw,th)为所述预测人脸框相对于对应的默认人脸框的偏置信息;所述计算出真实人脸框相对于对应的默认人脸框的偏置信息,包括:根据每个默认人脸框与对应的真实人脸框,按照以下公式计算所述真实人脸框相对于对应的默认人脸框的偏置信息:其中,(xa,ya,wa,ha)为默认人脸框的中心点坐标、宽和高;(x*,y*,w*,h*)为真实人脸框的中心点坐标、宽和高;为所述真实人脸框相对于对应的默认人脸框的偏置信息。优选地,所述根据所述预测人脸框相对于对应的默认人脸框的偏置信息,以及所述真实人脸框相对于对应的默认人脸框的偏置信息,计算预测人脸框偏置的网络层的损失函数,包括:选取所述默认人脸框相对于对应的真实人脸框的相对面积大于预设的第一相对面积阈值时所对应的默认人脸框作为采样默认人脸框;其中,所述相对面积为默认人脸框与真实人脸框的相交区域的面积除以默认人脸框与真实人脸框的并集区域的面积;根据预测人脸框相对于对应的采样默认人脸框的偏置信息,以及所述真实人脸框相对于对应的采样默认人脸框的偏置信息,按照以下公式计算预测人脸框偏置的网络层的损失函数:其中,Nreg为采样默认人脸框的数量,T=tx,ty,tw,th为预测人脸框相对于对应的采样默认人脸框的偏置信息,为真实人脸框相对于对应的采样默认人脸框的偏置信息;所述根据所述默认人脸框包含人脸的置信度,计算预测人脸框置信度的网络层的损失函数,包括:将所述默认人脸框相对于对应的真实人脸框的相对面积大于预设的第一相对面积阈值时所对应的默认人脸框作为正样本,将所述默认人脸框相对于对应的真实人脸框的相对面积小于或等于预设的第一相对面积阈值时所对应的默认人脸框作为负样本;按照预设的正负样本比例选取全部正样本及部分负样本;按照以下公式计算预测人脸框置信度的网络层的损失函数:Lcls(p,p*)=-[p*logp+(1-p*)log(1-p)]其中,pi为选取的正样本或负样本包含人脸的置信度,为选取的正样本或负样本包含人脸的真实概率,正样本的为1,负样本的为0,Ncls为选取的正负样本的总数量。优选地,所述计算所述预测人脸框偏置的网络层的损失函数与所述预测人脸框置信度的网络层的损失函数的误差,包括:采用随机梯度下降法计算所述预测人脸框偏置的网络层的损失函数与所述预测人脸框置信度的网络层的损失函数的梯度;将得到的梯度值作为所述预测人脸框偏置的网络层的损失函数与所述预测人脸框置信度的网络层的损失函数的误差。本专利技术的另一目的在于提供一种基于神经网络的人脸检测方法,所述神经网络包括:人脸检测的网络层、预测人脸框偏置的网络层及预测人脸框置信度的网络层;其中,所述人脸本文档来自技高网
...
基于神经网络的人脸检测模型的训练、人脸检测方法及系统

【技术保护点】
一种基于神经网络的人脸检测模型的训练方法,其特征在于,所述神经网络包括:人脸检测的网络层、预测人脸框偏置的网络层及预测人脸框置信度的网络层;其中,所述人脸检测的网络层是根据所述神经网络中不同网络层对应训练集中的人脸图像的感受野选取的,所述人脸检测的网络层中的每个胞元绑定六个默认人脸框,所述默认人脸框是根据对应的人脸检测的网络层规模设置的;每层人脸检测的网络层连接一层预测人脸框偏置的网络层及一层预测人脸框置信度的网络层;所述方法包括:接收到模型训练指令时,将所述训练集中的人脸图像输入到所述神经网络中进行训练;通过预测人脸框偏置的网络层计算出预测人脸框相对于对应的默认人脸框的偏置信息,以及计算出真实人脸框相对于对应的默认人脸框的偏置信息;并通过预测人脸框置信度的网络层计算出每个默认人脸框包含人脸的置信度;根据所述预测人脸框相对于对应的默认人脸框的偏置信息,以及所述真实人脸框相对于对应的默认人脸框的偏置信息,计算预测人脸框偏置的网络层的损失函数;并根据所述默认人脸框包含人脸的置信度,计算预测人脸框置信度的网络层的损失函数;计算所述预测人脸框偏置的网络层的损失函数与所述预测人脸框置信度的网络层的损失函数的误差,并将所述误差通过反向传播反馈到所述神经网络中,根据所述误差更新所述神经网络的网络权重参数以及根据更新后的网络权重参数调整预测人脸框;重复迭代训练直至调整后的预测人脸框与真实人脸框的误差在预设的误差范围之内,输出人脸检测模型。...

【技术特征摘要】
1.一种基于神经网络的人脸检测模型的训练方法,其特征在于,所述神经网络包括:人脸检测的网络层、预测人脸框偏置的网络层及预测人脸框置信度的网络层;其中,所述人脸检测的网络层是根据所述神经网络中不同网络层对应训练集中的人脸图像的感受野选取的,所述人脸检测的网络层中的每个胞元绑定六个默认人脸框,所述默认人脸框是根据对应的人脸检测的网络层规模设置的;每层人脸检测的网络层连接一层预测人脸框偏置的网络层及一层预测人脸框置信度的网络层;所述方法包括:接收到模型训练指令时,将所述训练集中的人脸图像输入到所述神经网络中进行训练;通过预测人脸框偏置的网络层计算出预测人脸框相对于对应的默认人脸框的偏置信息,以及计算出真实人脸框相对于对应的默认人脸框的偏置信息;并通过预测人脸框置信度的网络层计算出每个默认人脸框包含人脸的置信度;根据所述预测人脸框相对于对应的默认人脸框的偏置信息,以及所述真实人脸框相对于对应的默认人脸框的偏置信息,计算预测人脸框偏置的网络层的损失函数;并根据所述默认人脸框包含人脸的置信度,计算预测人脸框置信度的网络层的损失函数;计算所述预测人脸框偏置的网络层的损失函数与所述预测人脸框置信度的网络层的损失函数的误差,并将所述误差通过反向传播反馈到所述神经网络中,根据所述误差更新所述神经网络的网络权重参数以及根据更新后的网络权重参数调整预测人脸框;重复迭代训练直至调整后的预测人脸框与真实人脸框的误差在预设的误差范围之内,输出人脸检测模型。2.根据权利要求1所述的训练方法,其特征在于,所述通过预测人脸框偏置的网络层计算出预测人脸框相对于对应的默认人脸框的偏置信息,包括:按照以下公式计算出预测人脸框相对于对应的默认人脸框的偏置信息:tx=(x-...

【专利技术属性】
技术研发人员:邵枭虎吕江靖覃勋辉周祥东石宇
申请(专利权)人:中国科学院重庆绿色智能技术研究院
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1