当前位置: 首页 > 专利查询>中山大学专利>正文

基于堆叠沙漏网络的关键特征区域匹配人脸识别方法技术

技术编号:20918101 阅读:25 留言:0更新日期:2019-04-20 10:01
本发明专利技术涉及计算机视觉识别技术领域,提出一种基于堆叠沙漏网络的关键特征区域匹配人脸识别方法,包括以下步骤:采集训练集,并进行预处理;对输入人脸图片进行预处理;将图片输入堆叠沙漏网络中进行特征提取,输出人脸关键点热图和关键点位置信息;对原图片进行关键区域裁剪,并从训练集中选取三元组;将关键区域进行特征提取,得到特征图F;将特征图F输入嵌入层中得到标签E;根据特征图的L2范数计算三元损失函数,重复上述步骤至三元损失函数收敛;将待识别的人脸图片输入完成训练的堆叠沙漏网络和人脸识别模块中,输出识别的标签E。本发明专利技术引入堆叠沙漏网络进行人脸识别,排除非关键区域的影响,有效提高人脸识别效果,具有较强的鲁棒性。

Face Recognition Based on Stacked Hourglass Network with Key Feature Region Matching

The invention relates to the field of computer vision recognition technology, and proposes a face recognition method based on key feature area matching of stacked hourglass network, which includes the following steps: collecting training set and preprocessing; preprocessing input face images; extracting features by inputting pictures into stacked hourglass network, and outputting hot maps of key points and position information of key points of faces; The original image is clipped from the key area and the triple is selected from the training set; the key area is extracted to get the feature graph F; the feature graph F is input into the embedded layer to get the label E; the triple loss function is calculated according to the L2 norm of the feature graph, and the steps mentioned above are repeated until the triple loss function converges; the face image to be recognized is input into the stacked hourglass network and human beings to complete the training. In the face recognition module, the tag E of recognition is output. The invention introduces stacked hourglass network for face recognition, eliminates the influence of non-critical areas, effectively improves the face recognition effect and has strong robustness.

【技术实现步骤摘要】
基于堆叠沙漏网络的关键特征区域匹配人脸识别方法
本专利技术涉及计算机视觉识别
,更具体地,涉及一种基于堆叠沙漏网络的关键特征区域匹配人脸识别方法。
技术介绍
近年随着深度卷积神经网络的提出,人们将其运用到人脸识别任务上,并取得良好效果,这很大一部分归功于深度卷积神经网络能够提取到具有鲁棒性的特征。在人脸关键点检测领域,有相关科研人员提出利用堆叠沙漏网络进行人脸关键点定位,该方法首先对输入的人脸图片进行校正,然后经过堆叠沙漏网络提取多尺度且具有辨别力的特征,最后对关键点进行回归定位。现有技术中,有大量算法都是基于上述堆叠沙漏网络进行改进,但目前仍存在的一个具有挑战性问题是对于不同光照、不同姿态、不同表情下,现有技术中已有的算法对人脸图片输入均不具有很强的鲁棒性。
技术实现思路
本专利技术为克服上述现有技术所述的对输入的人脸图片不具备很强鲁棒性等至少一种缺陷,提供一种基于堆叠沙漏网络的关键特征区域匹配人脸识别方法,该方法对输入的人脸图片具有更强的鲁棒性,能更精确地提取人脸关键点信息。为解决上述技术问题,本专利技术的技术方案如下:S1:采集人脸图片作为训练集,并对训练集的图片进行预处理;S2:将训练集的任意一张人脸图片输入堆叠沙漏网络中进行特征提取,输出人脸关键点热图和关键点位置信息;S3:根据所述关键点位置信息对原输入人脸图片进行区域裁剪得到关键区域,并从训练集中随机选出一张图片作为A组,再分别随机选出与A组图片属同一标签的样本图片作为P组,与A组图片不同标签的样本图片作为N组,组成三元组;S4:将关键区域和三元组输入人脸识别模块中的卷积神经网络进行特征提取,得到特征图F;S5:对特征图F求取L2范数,然后通过人脸识别模块中的嵌入层,输出完成识别的人脸图片的标签E;S6:根据L2范数计算三元损失函数,通过梯度下降法对三元损失函数进行优化;S7:重复S2~S6至三元损失函数收敛,完成堆叠沙漏网络和人脸识别模块的训练;S8:将待识别的人脸图片输入堆叠沙漏网络中进行特征提取,裁剪图片的关键区域,然后输入卷积神经网络中进行特征提取,最后通过嵌入层输出识别的人脸图片标签。本技术方案中,采用堆叠沙漏网络输入人脸图片进行人脸关键点定位,精确地提取关键点信息,再输入人脸识别模块中生成更具身份信息的特征,从而进行人脸识别。使用堆叠沙漏网络与单独使用一个沙漏结构网络相比,堆叠沙漏网络能够复用脸部信息来提高各个关键点的精度,在人脸识别过程中,可根据关键点的位置预测其他关键点的位置。如确认了人脸图片中的人脸位置信息后,可预测鼻子等其他五官的位置,因此可通过堆叠沙漏网络利用关键点之间的相互关系,能够进一步提升人脸识别的精度。同时,在对关键区域的特征提取之前,对关键区域进行裁剪,能够进一步对关键区域进行限制,去除非关键区域的信息干扰,有效提高鲁棒性。优选地,S1步骤中对训练集图片的预处理包括人脸检测、裁剪、人脸矫正以及人工标记,对图片进行预处理可以去除大部分的非关键区域的干扰因素,并把图片进行矫正,避免人脸图片的模糊或畸变影响后续的人脸识别,以及人工对训练集图片进行标记可以对后续识别结果进行验证对比,从而优化网络参数。优选地,堆叠沙漏网络包括4个密集连接的沙漏结构网络。优选地,S2步骤的具体步骤如下:S2.1:将人脸图片输入第一个沙漏结构网络中进行四次下采样,保留每次下采样的图片,记为d1,d2,d3,d4;S2.2:将d4输入到残差模块中,再进行四次上采样,同时每次上采样时和下采样对应尺寸的特征图进行连接,输出特征图y1,同时保留每次上采样的图片;S2.3:将特征图y1输入第二个沙漏结构网络中进行四次下采样,每次下采样时和上一个沙漏结构网络上采样中对应尺寸的特征图进行连接,再输入残差模块中进行四次上采样,每次上采样时和该沙漏结构网络中下采样对应尺寸的特征图进行连接,输出特征图y2,保留每次采样时的图片;S2.4:重复S2.3步骤,至输入第4个沙漏结构网络,输出带有关键点位置信息的特征图y4。本技术方案中,对于同一个沙漏结构网络,每一次下采样所输出的特征图与上采样时对应尺寸大小的特征图进行连接,而在堆叠沙漏网络中,已通过的沙漏结构网络会传递其上采样和下采样的多个特征图到后方沙漏网络对应的位置进行特征图连接,有助于准确地得到人脸关键点位置信息。优选地,S3步骤的具体步骤如下:S3.1:根据关键点位置信息对原输入人脸图片进行关键区域裁剪,得到若干个关键区域;S3.2:从训练集中随机选出一张图片作为A(Anchor)组,从与A(Anchor)组图片属于同一类的图片中随机选取一张图片作为P(Positive)组,从与A(Anchor)组图片不属于同一类的图片中随机选取一张图片作为N(Negative)组,组成三元组。本技术方案中,由于非关键区域包含大量除身份信息以外的特征,如光照、姿态等,因此通过根据关键点位置信息对人脸图片进行关键区域裁剪,能够有效提高人脸识别的效果以及提高堆叠沙漏网络的鲁棒性。优选地,关键区域裁剪的裁剪尺寸为p,其中p为人为设置的阈值。优选地,S4步骤中的具体步骤如下:将裁剪得到的关键区域及三元组输入人脸识别模块中的卷积神经网络进行特征提取并进行串接,得到特征图F。优选地,卷积神经网络包括Inception模块。优选地,S5步骤的具体步骤如下:S5.1:对特征图F求取L2范数,其计算公式如下:其中,||x||2表示特征图F的L2范数,xi表示特征图F的权重值组成的向量中的第i个元素;S5.2:将求取的L2范数输入到人脸识别模块的嵌入层中,使特征映射到超球面上,输出完成识别的人脸图片的标签E。本技术方案中通过对特征图F求取L2范数,可以有效防止模型过拟合。优选地,S6步骤的三元损失函数的计算公式如下:其中,表示A组图片,表示P组图片,表示N组图片,f(*)表示对应图片的特征图,α为A、P的类内距离与A、N的类间距离的间隔大小,+表示当括号内数值大于0时,取该值为损失,当括号内数值小于或等于0时,取0位损失。本技术方案通过三元损失函数对堆叠沙漏网络代替二元损失函数,如Softmax函数,能使A、P的类内距离尽可能小的同时,对A、N的类间距离进行约束,使A、N的类间距离尽可能拉大,并通过梯度下降法对损失函数不断进行优化,使人脸识别模块能更好地区分不同类别的人脸,提高识别能力。与现有技术相比,本专利技术技术方案的有益效果是:通过堆叠沙漏网络对人脸图片获取关键点信息,使人脸关键点信息的提取更加精确,且能够有效提高人脸识别模型的识别能力及鲁棒性,能够更精确地对人脸图片进行识别。附图说明图1为本实施例的基于堆叠沙漏网络的关键特征区域匹配人脸识别方法的流程图。具体实施方式附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。下面结合附图和实施例对本专利技术的技术方案做进一步的说明。如图1所示,为本实施例的基于堆叠沙漏网络的关键特征区域匹配人脸识别方法的流程图。本实施例的基于堆叠沙漏网络的关键特征区域匹配人脸识别方法包括以下步骤:步骤一:采集人脸图片作为训练集,并对训练集的图片进行预处理。本步骤中,本文档来自技高网...

【技术保护点】
1.基于堆叠沙漏网络的关键特征区域匹配人脸识别方法,其特征在于,包括以下步骤:S1:采集人脸图片作为训练集,并对训练集的图片进行预处理;S2:将训练集的任意一张人脸图片输入堆叠沙漏网络中进行特征提取,输出人脸关键点热图和关键点位置信息;S3:根据所述关键点位置信息对原输入人脸图片进行区域裁剪得到关键区域,并从训练集中选取三元组;S4:将关键区域输入人脸识别模块中的卷积神经网络进行特征提取,得到特征图F;S5:对特征图F求取L2范数,然后通过人脸识别模块中的嵌入层,输出完成识别的人脸图片的标签E;S6:根据L2范数计算三元损失函数,通过梯度下降法对三元损失函数进行优化;S7:重复S2~S6至三元损失函数收敛,完成堆叠沙漏网络和人脸识别模块的训练;S8:将待识别的人脸图片输入堆叠沙漏网络中进行特征提取,裁剪图片的关键区域,然后输入卷积神经网络中进行特征提取,最后通过嵌入层输出识别的人脸图片标签。

【技术特征摘要】
1.基于堆叠沙漏网络的关键特征区域匹配人脸识别方法,其特征在于,包括以下步骤:S1:采集人脸图片作为训练集,并对训练集的图片进行预处理;S2:将训练集的任意一张人脸图片输入堆叠沙漏网络中进行特征提取,输出人脸关键点热图和关键点位置信息;S3:根据所述关键点位置信息对原输入人脸图片进行区域裁剪得到关键区域,并从训练集中选取三元组;S4:将关键区域输入人脸识别模块中的卷积神经网络进行特征提取,得到特征图F;S5:对特征图F求取L2范数,然后通过人脸识别模块中的嵌入层,输出完成识别的人脸图片的标签E;S6:根据L2范数计算三元损失函数,通过梯度下降法对三元损失函数进行优化;S7:重复S2~S6至三元损失函数收敛,完成堆叠沙漏网络和人脸识别模块的训练;S8:将待识别的人脸图片输入堆叠沙漏网络中进行特征提取,裁剪图片的关键区域,然后输入卷积神经网络中进行特征提取,最后通过嵌入层输出识别的人脸图片标签。2.根据权利要求1所述的基于堆叠沙漏网络的关键特征区域匹配人脸识别方法,其特征在于:所述S1步骤中对训练集图片的预处理包括人脸检测、裁剪、人脸矫正以及人工标记。3.根据权利要求2所述的基于堆叠沙漏网络的关键特征区域匹配人脸识别方法,其特征在于:所述堆叠沙漏网络包括4个密集连接的沙漏结构网络。4.根据权利要求3所述的基于堆叠沙漏网络的关键特征区域匹配人脸识别方法,其特征在于:所述S2步骤的具体步骤如下:S2.1:将人脸图片输入第一个沙漏结构网络中进行四次下采样,保留每次下采样的图片,记为d1,d2,d3,d4;S2.2:将d4输入到残差模块中,再进行四次上采样,同时每次上采样时和下采样对应尺寸的特征图进行连接,输出特征图y1,同时保留每次上采样的图片;S2.3:将特征图y1输入第二个沙漏结构网络中进行四次下采样,每次下采样时和上一个沙漏结构网络上采样中对应尺寸的特征图进行连接,再输入残差模块中进行四次上采样,每次上采样时和该沙漏结构网络中下采样对应尺寸的特征...

【专利技术属性】
技术研发人员:胡海峰冯燊明
申请(专利权)人:中山大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1