一种利用上下文信息的三分类人脸检测方法技术

技术编号：18712849 阅读：45 留言：0更新日期：2018-08-21 22:58

本发明专利技术公开了一种利用上下文信息的三分类人脸检测方法，包括以下步骤：步骤1、数据准备：a、对图像集合中的每一张人脸进行人工标注，获得人脸框；b、将标注完成的人脸框按照大小进行分类，并对小人脸区域进行放大，其余标注为正常脸；c、将步骤b获得的带有标注的人脸图像集合分为训练集和校验集；步骤2、模型设计：设计端到端的神经网络模型，包括基础卷积网络、区域建议网络和精调网络；步骤3、模型训练：经训练集输入步骤2设计的神经网络模型，利用批次随机梯度下降方法进行模型训练；利用校验集验证模型训练效果；最终得到人脸检测模型。本发明专利技术极大提高了人脸检测的精度和人脸的召回率。

A three classification face detection method using context information

The invention discloses a three-class face detection method utilizing context information, which comprises the following steps: step 1, data preparation: a, labeling each face in the image set manually to obtain the face frame; b, classifying the labeled face frame according to its size, and enlarging the small face region; The rest are labeled as normal faces; C. Divide the labeled face image set obtained by step B into training set and checking set; Step 2, Model design: Designing end-to-end neural network model, including basic convolution network, area recommendation network and fine-tuning network; Step 3, Model training: Designed by training set input step 2. Neural network model is trained by batch stochastic gradient descent method, the training effect is validated by checkset, and the face detection model is finally obtained. The invention greatly improves the accuracy of face detection and the recall rate of face.

全部详细技术资料下载

【技术实现步骤摘要】
一种利用上下文信息的三分类人脸检测方法
本专利技术涉及人脸检测方法，尤其涉及一种利用上下文信息的三分类人脸检测方法。
技术介绍
人脸检测是指对于任意一幅给定的图像，采用一定的策略对其进行搜索以确定其中是否含有人脸(存在)则返回人脸的位置、大小和姿态。人脸的处理和分析包括人脸识别、人脸跟踪、姿势估计和表情识别等，其中人脸检测是所有人脸信息处理中关键的第一步。目前的人脸检测方法大多基于深度神经网络框架。主要方法有：1)基于级联卷积神经网络的人脸检测。相关专利：CN107688786A。主要技术手段：首先进行图像预处理，对测试图像进行尺度变换，输入第一层级网络。其次在后续阶段，对人脸框进行筛选与进一步回归，对人脸进行过滤。问题和缺点：该类方法需要设定最小人脸参数，且对检测结果有较强影响；其次，第一阶段的网络深度一般，导致人脸召回不高，导致精度下降。2)基于卷积神经网络的人脸检测方法及装置。相关专利：CN107633229A。主要技术手段：采用双肤色分割法提取前景信息，再从中筛选出候选区域，进行训练。问题和缺点：采用肤色分割法从待检图片提取前景区域精度欠佳，对不同肤色人种鲁棒性较弱，直接导致选取训练所用的基于候选区的样本不准确；其次，针对图中尺度较小的人脸，检测能力较差。
技术实现思路
为了解决上述技术所存在的不足之处，本专利技术提供了一种利用上下文信息的三分类人脸检测方法。为了解决以上技术问题，本专利技术采用的技术方案是：一种利用上下文信息的三分类人脸检测方法，包括以下步骤：步骤1、数据准备：a、对RGB图像集合中的每一张人脸进行人工标注，获得人脸框；b、将标注完成...

【技术保护点】
1.一种利用上下文信息的三分类人脸检测方法，其特征在于：包括以下步骤：步骤1、数据准备：a、对RGB图像集合中的每一张人脸进行人工标注，获得人脸框；b、将标注完成的人脸框按照大小进行分类，将大小在20*20像素以内的人脸框标注为小人脸，并对小人脸区域进行放大，其余标注为正常脸；c、将步骤b获得的带有标注的人脸图像集合分为训练集和校验集；步骤2、模型设计：设计端到端的神经网络模型，包括基础卷积网络、区域建议网络和精调网络；步骤3、模型训练：经训练集输入步骤2设计的神经网络模型，利用批次随机梯度下降方法进行模型训练；利用校验集验证模型训练效果；最终得到人脸检测模型。

【技术特征摘要】
1.一种利用上下文信息的三分类人脸检测方法，其特征在于：包括以下步骤：步骤1、数据准备：a、对RGB图像集合中的每一张人脸进行人工标注，获得人脸框；b、将标注完成的人脸框按照大小进行分类，将大小在20*20像素以内的人脸框标注为小人脸，并对小人脸区域进行放大，其余标注为正常脸；c、将步骤b获得的带有标注的人脸图像集合分为训练集和校验集；步骤2、模型设计：设计端到端的神经网络模型，包括基础卷积网络、区域建议网络和精调网络；步骤3、模型训练：经训练集输入步骤2设计的神经网络模型，利用批次随机梯度下降方法进行模型训练；利用校验集验证模型训练效果；最终得到人脸检测模型。2.根据权利要求1所述的三分类人脸检测方法，其特征在于：所述步骤1中，标注人脸框的位置、尺寸与真实数据之间误差不得超过10％，在人脸被部分遮挡的情况下也应标注出准确位置；对于正脸，上边界为额头边缘，下边界为下巴，左右边界为耳根；对于侧脸，上边界为额头边缘，下边界为下巴，左右边界一个为耳根，另一个为面颊边缘或者鼻尖靠外一方。3.根据权利要求1所述的三分类人脸检测方法，其特征在于：所述步骤2中的神经网络模型中，所述基础卷积网络将输入的训练集数据进行一系列卷积层，得到特征图，并送入区域建议网络；区域建议网络以基础卷积网络得到的特征图上每个点为锚心，以锚的大小提取前景区域；精调网络结合基础网络得到的特征图和区...

【专利技术属性】
技术研发人员：姜丰，张杰，山世光，
申请(专利权)人：中科视拓北京科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人