一种抗年龄干扰的人脸识别方法技术

技术编号:21548580 阅读:34 留言:0更新日期:2019-07-06 21:50
本发明专利技术公开了一种抗年龄干扰的人脸识别方法,采用端到端的非级联结构深度卷积神经网络对同一个人不同年龄阶段的图片进行特征提取及人脸识别,包括:通过跨年龄人脸数据库获得图片,形成训练集和测试集;采用增大数据集的方法对数据进行扩充形成训练图像;建立含有7个卷积层、3个最大值池化层、1个全连层和一个softmax层的端到端的非级联结构深度卷积神经网络并对其进行网络训练;通过深度神经网络来提取人脸深层次的抽象的特征的方式进行人脸识别;不仅能更好的兼具时间和性能两个优势,还对人脸角度、光照强度及遮挡程度有较好的适应性,有效克服了年龄变化对人脸识别带来的影响,提高了跨年龄人脸识别的精度。

A Face Recognition Method Against Age Disturbance

【技术实现步骤摘要】
一种抗年龄干扰的人脸识别方法
本专利技术涉及计算机视觉领域(ComputerVision)和深度学习领域(DeepLearning),具体的说,是一种抗年龄干扰的人脸识别方法。
技术介绍
人脸识别系统以人脸识别技术为核心,是一项新兴的生物识别技术,是当今国际科技领域攻关的高精尖技术。它广泛采用区域特征分析方法,融合了计算机图像处理技术与生物统计学原理于一体,利用计算机图像处理技术从视频中提取人像特征点,利用生物统计学的原理进行分析建立数学模型,具有广阔的发展前景。2006年,美国已经要求和它有出入免签证协议的国家在10月26日之前必须使用结合了人脸识别的电子护照系统,到2006年底已经有50多个国家实现了这样的系统。2012年4月,铁路部门宣布车站安检区域将安装用于身份识别的高科技安检系统人脸识别系统;可以对人脸明暗侦测,自动调整动态曝光补偿,人脸追踪侦测,自动调整影像放大。人脸,作为识别一个人最显著的区域,被广泛地应用于各种场合的身份识别。一般来说,人脸的识别方法包括四个步骤:图片采集及检测、图片预处理、图片特征提取、人脸匹配与验证。通常使用一些人工设定的特征描述字,例如LBP、SIFT和Gabor等,来表示人脸数据,利用余弦距离来度量一对图像的相似度,从而实现判断验证。但是随着年龄的增长,人的脸部会不可避免地产生变化(如图1所示)。在一些场合,只是一个人不同年龄段的照片,例如只有十几年前的照片,需要将备选人员的头像与已有的线索进行比对验证,以达到目的,这就要求进行跨年龄人脸验证。所谓跨年龄人脸验证,就是给定一些不同年龄段的图片,判定这些图片是否属于同一个人。如果人脸验证方法能够应对人脸随着年龄的增长而产生的变化,在档案管理系统、安全验证系统、公安系统的罪犯身份识别、银行和海关的监控等领域,将具有广阔的应用前景。为了实现跨年龄验证,大多数传统的方法是对年龄进行建模,通过设计人脸成长模型来进行跨年龄的人脸验证。然而,这类方法往往需要依赖先验,比如说个体的实际年龄,而并不是所有数据集都能够提供年龄信息。深度学习方法模拟人脑的层次处理结构,以简洁的表达方式刻画数据丰富的内在信息,它是一种高度非线性的模型,具有超强的数据拟合能力和学习能力,表达能力更强,更能刻画数据丰富的内在信息。深度网络可以无监督地从数据中学习到特征,这种方式学习到的特征也符合人类感知世界的机理,而且通过深度学习方法学习到的特征往往具有一定的语义特征。就人脸验证中最关键的步骤特征提取而言,目前主要存在两个问题:1、图片的单调性。目前已知的大量人脸数据集中,图片往往是比较单调的,而且目前大多数方法都是在单尺度上做的,这样提取的特征往往不够丰富,不足以表征人脸。2、另一个值得关注的问题就是特征的获取。传统的人脸验证采用的都是手工设计的特征,这种特征针对性比较高,但是一般都是低层特征,往往不包含语义信息,而且泛化能力不强。随着大数据时代的到来,数据量也越来越大,如何自动地获取特征成为一个值得研究的课题。
技术实现思路
本专利技术的目的在于提供一种抗年龄干扰的人脸识别方法,不仅能更好的兼具时间和性能两个优势(时间更短/性能更强),还对人脸角度、光照强度及遮挡程度有较好的适应性,还有效克服了年龄变化对人脸识别带来的影响,解决了现有技术对跨年龄人脸的识别能力较差的问题,提高了跨年龄人脸识别的精度。本专利技术通过下述技术方案实现:一种抗年龄干扰的人脸识别方法,采用端到端的非级联结构深度卷积神经网络对同一个人不同年龄阶段的图片进行特征提取及人脸识别。进一步的为更好地实现本专利技术,特别采用下述设置方式:所述人脸识别方法包括以下步骤:1)数据准备:通过跨年龄人脸数据库获得图片,形成训练集和测试集;2)采用增大数据集的方法对数据进行扩充形成训练图像;3)建立含有7个卷积层、3个最大值池化层、1个全连层和一个softmax层的端到端的非级联结构深度卷积神经网络并对端到端的非级联结构深度卷积神经网络进行网络训练;4)通过深度神经网络来提取人脸深层次的抽象的特征的方式进行人脸识别。进一步的为更好地实现本专利技术,特别采用下述设置方式:所述步骤1)包括以下具体步骤:1.1)从CACD数据库中获取图片形成训练集,从MORPH数据库中获取图片形成测试集;1.2)将训练集划分成不同的年龄组,并将CACD数据库中的每一个人作为一个类别,生成类别标签文件,记录在txt文件中;1.3)经步骤1.2)后,对训练集中的多幅图片进行预处理(人脸提取、人脸矫正、图像尺寸固定),将图片按统一模式剪切出来,并缩放到统一大小128x128。预处理的目的在于:由于原始图片是带有大面积背景的图片,为了减小干扰,将图片的主体-人脸从图片里面剪切出来。进一步的为更好地实现本专利技术,特别采用下述设置方式:所述年龄组以每5岁一个跨度。进一步的为更好地实现本专利技术,特别采用下述设置方式:所述步骤2)包括以下步骤:2.1)通过celebFaces增加新的数据,形成新的数据集之后,对它进行人脸提取、人脸矫正、图像尺寸固定至128×128;新的数据集指为扩充训练集容量而将celebFaces添加到训练集后所形成的新的训练集;2.2)经步骤2.1)后,对所有图片进行5次随机裁剪,随机裁剪完成后将所得图片的尺寸固定为128×128;2.3)将步骤2.2)经过尺寸固定后的所有图片进行随机亮度调节或/和对比度调节,形成训练图像。进一步的为更好地实现本专利技术,特别采用下述设置方式:所述端到端的非级联结构深度卷积神经网络在建立时使用SGD类型的算法来求解优化,设置的基础学习率为0.001,通过step的方式在迭代过程中对基础学习率进行调整;配置网络结构以及solver文件中的参数完成后,利用caffe.exe进行网络训练。进一步的为更好地实现本专利技术,特别采用下述设置方式:所述网络训练的具体步骤为:3.1)将128×128×3大小的训练图像输入端到端的非级联结构深度卷积神经网络,经过三层卷积操作、归一化操作、非线性激活操作及池化层操作后得到64×64×64的特征矩阵;其中,128×128指的是训练图像的长度和宽度,后面的3代表了通道数,常见的图片都是RGB彩色三通道图;灰度图和黑白图只有一个通道,即width*height*1;3.2)将步骤3.1)所得的64×64×64的特征矩阵经过三层卷积操作、归一化操作、非线性激活操作及池化层操作后得到32×32×128的特征矩阵;3.3)将步骤3.2)所得32×32×128的特征矩阵经过一层卷积操作、非线性激活操作、池化层操作得到16×16×256的特征矩阵;3.4)将步骤3.3)所得的16×16×256的特征矩阵通过FC(FullConnected,即全连接层)操作、softmax处理,输出N维向量。进一步的为更好地实现本专利技术,特别采用下述设置方式:所述步骤4)包括以下具体步骤:4.1)将两张测试集中的图片送入训练好的端到端的非级联结构深度卷积神经网络;4.2)将训练好的端到端的非级联结构深度卷积神经网络的softmax层去掉,而后对步骤4.1)所送入的图片进行特征提取;4.3)经步骤4.2)后提取得到的256维特征向量通过欧式距离计算;4.4)将经过欧氏距离计算所得结果通过阈值比较后,判断两张图本文档来自技高网
...

【技术保护点】
1.一种抗年龄干扰的人脸识别方法,其特征在于:采用端到端的非级联结构深度卷积神经网络对同一个人不同年龄阶段的图片进行特征提取及人脸识别。

【技术特征摘要】
2019.01.30 CN 201910089331X1.一种抗年龄干扰的人脸识别方法,其特征在于:采用端到端的非级联结构深度卷积神经网络对同一个人不同年龄阶段的图片进行特征提取及人脸识别。2.根据权利要求1所述的一种抗年龄干扰的人脸识别方法,其特征在于:所述人脸识别方法包括以下步骤:1)数据准备:通过跨年龄人脸数据库获得图片,形成训练集和测试集;2)采用增大数据集的方法对数据进行扩充形成训练图像;3)建立含有7个卷积层、3个最大值池化层、1个全连层和一个softmax层的端到端的非级联结构深度卷积神经网络,并对端到端的非级联结构深度卷积神经网络进行网络训练;4)通过深度神经网络来提取人脸深层次的抽象的特征的方式进行人脸识别。3.根据权利要求2所述的一种抗年龄干扰的人脸识别方法,其特征在于:所述网络训练的具体步骤为:3.1)将128×128×3大小的训练图像输入端到端的非级联结构深度卷积神经网络,经过三层卷积操作、归一化操作、非线性激活操作及池化层操作后得到64×64×64的特征矩阵;3.2)将步骤3.1)所得的64×64×64的特征矩阵经过三层卷积操作、归一化操作、非线性激活操作及池化层操作后得到32×32×128的特征矩阵;3.3)将步骤3.2)所得32×32×128的特征矩阵经过一层卷积操作、非线性激活操作、池化层操作得到16×16×256的特征矩阵;3.4)将步骤3.3)所得的16×16×256的特征矩阵通过FC操作、softmax处理,输出N维的向量。4.根据权利要求2或3所述的一种抗年龄干扰的人脸识别方法,其特征在于:所述端到端的非级联结构深度卷积神经网络在建立时使用SGD类型的算法来求解优化,设置的基础学习率为0.001,通过step的方式在迭代过程中对基础学习率进行调整;配置网络结构以及solver文件中的参数完成后,利用caffe.exe进行网络训练。5.根据权利要求2或3所述的一种抗年龄干扰的人脸识...

【专利技术属性】
技术研发人员:殷光强向凯王志国王春雨
申请(专利权)人:四川电科维云信息技术有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1