一种基于LBP和深度学校的非限制条件下人脸识别方法技术

技术编号:15501790 阅读:51 留言:0更新日期:2017-06-03 22:59
本发明专利技术公开了一种基于LBP和深度学校的非限制条件下人脸识别方法,包括测试样本、训练样本、预处理、LBP纹理特征、DBN深度学习和识别结果。其优点在于:本发明专利技术采用的LBP和DBN相结合的非限制条件下人脸识别,在LFW人脸库上的实验结果表明,能够自下而上自动提取非限制条件下人脸图像的有效特征;将LBP与DBN相结合,克服了DBN不能学习到人脸图像局部结构特征的缺点,使得DBN学习到的抽象特征受光照、微小平移等的影响较小;本发明专利技术在受姿态、光照、表情、遮挡等综合因素影响的非限制条件下具有较好的识别效果,同时在受多种因素影响的Yale 库和光照因素影响的Yale‑B 库上取得较高的识别率。

A face recognition method under unrestricted conditions based on LBP and deep school

The invention discloses a face recognition method under unrestricted conditions based on LBP and deep school, comprising a test sample, a training sample, a preprocessing, a LBP texture feature, a DBN depth learning and a recognition result. The utility model has the advantages of non restrictive conditions of the invention adopts LBP and DBN combination of face recognition, the experimental results on LFW face database show that the bottom-up can automatic extract the effective features of face images under non limiting conditions; LBP combined with DBN, DBN can learn to overcome the local structural features of face images the shortcomings of abstract features makes DBN learn less affected by light, the shifting; the invention has good recognition effect on posture and illumination, facial expression and occlusion comprehensive factors such as the effect of non restrictive conditions, and their effects on factors affected Yale base and light factors Yale B library achieved higher recognition rate.

【技术实现步骤摘要】
一种基于LBP和深度学校的非限制条件下人脸识别方法
本专利技术涉及人脸识别
,特别是一种基于LBP和深度学校的非限制条件下人脸识别方法。
技术介绍
人脸识别作为非入侵式的生物特征识别方法,在国防安全、视频监控、人机交互等方面具有广泛的应用。传统人脸识别算法在受某种或某几种特定因素影响的限制条件下能够获得较好的效果,但在非限制条件下识别性能急剧下降。目前,非限制条件下人脸识别研究可分为2类:基于3-D模型和2-D模型的人脸识别方法。其中,后者是研究的热点。基于3-D模型的人脸识别方法,对克服环境因素中姿态和光照影响非常有效。但3-D模型法计算复杂,拟合时间较长,不易达到实时性要求。2-D模型法主要将人脸图像中具有判别性的相对不变特征表达出来。Wolf等[3]对LBP(localbinarypattern)描述子进行优化,并将其与Gabor小波结合,试图获得非限制条件下人脸图像特征的最佳表示,但该算法特征提取过程有过多主动因素介Marsico等提出FACE(faceanalysisforcommer-cialentities)算法进行非限制条件下人脸识别,该算法主要通过对非限制条件下的姿态和光照进行归一化,从而得到非限制条件下的准确识别。在LFW(labeledfacesinthewild)库上识别率达到61%,但其识别性能过度依赖于对眼角、嘴巴、鼻尖等13个标注点的准确定位。现存算法所提取的人脸图像特征判别性不强,且特征的表达方式过度依赖于人工选择,但实际应用中研究者往往不知道如何准确选择和表达。最近,深度学习越来越受学者关注。深度学习模拟大脑组的深度组织结构,通过组合低层特征形成更抽象、更有效的高层表示。其中,深度信念网络(DBN,deepbeliefnetwork)是一种典型的深度学习方法,由Hinton在2006年首次提出,可称为第三代神经网络。它通过自下而上自动学习不同层次的抽象特征,最终获得特征的非线性描述,表达了一种不依赖于人工选择的特征自动提取过程。DBN已成功应用于手写数字识别、动态人体检测等诸多领域。但是,DBN忽略了图像局部结构,难以学习到人脸图像的局部特征;同时,以像素级的人脸特征作为DBN的输入,网络会因光照等因素影响而学习到不利的特征表达。LBP算子是由Ojala等提出的一种有效纹理描述子,能够刻画出人脸图像的亮点、暗点、边缘等局部微模式及其分布情况,且计算简单、运算速度快,具有光照和旋转不变性。LBP算子在动态纹理识别、表情分析、人脸识别等方面得到广泛应用。以LBP纹理特征作为DBN的输入,可有效避免深度学习中遇到的难题。二者相结合,能为人脸识别提供更科学的理论基础,而将其用于非限制条件人脸识别目前国内外报道不多。
技术实现思路
本专利技术的目的是提供一种能够进一步自动学习更抽象、更有效的人脸特征,并在DBN顶层自动进行人脸分类且有效避免了过多主动因素干预的基于LBP和深度学校的非限制条件下人脸识别方法。本专利技术采用的技术方案为:一种基于LBP和深度学校的非限制条件下人脸识别方法,其创新点在于,具体方法步骤如下:1)分别用双线性内插法将测试样本和训练样本降维至32×32,并进行直方图均衡化等归一化预处理;2)对训练样本和测试样本进行分块并提取每个子块的LBP纹理特征,将每个子块的特征连接起来形成样本的LBP纹理特征,其中LBP纹理特征提取时样本分块为4×5,半径R为1,像素数P为8,此时所提取的LBP纹理特征和像素级特征维数相当;3)将训练样本的LBP纹理特征作为DBN可视层输入,对深度网络进行逐层训练,以获取最优网络参数,文中DBN层数选为2层:第1层学习率为0.002,迭代次数为40;第2层为0.003,迭代次数为40;4)当深度网络训练完后,将测试样本的LBP纹理特征作为DBN可视层输入,利用优化后的网络由下向上多层次地学习和提取测试样本的抽象特征,在网络最顶层进行SoftMax回归分类,获得测试样本的类标值,并计算正确识别率。进一步的,所述DBN的训练过程如下:1)对第一层RBM,以LBP纹理特征为输入,对RBM进行无监督训练,获得该层最优的参数;2)高层RBM以低一层RBM输出数据为输入,对RBM进行无监督训练,获得RBM网络最优的参数值;3)最后利用全局训练的方法对训练好的各层参数微调,使DBN收敛到全局最优。本专利技术的有益效果如下:本专利技术采用的LBP和DBN相结合的非限制条件下人脸识别,在LFW人脸库上的实验结果表明,能够自下而上自动提取非限制条件下人脸图像的有效特征;将LBP与DBN相结合,克服了DBN不能学习到人脸图像局部结构特征的缺点,使得DBN学习到的抽象特征受光照、微小平移等的影响较小;本专利技术在受姿态、光照、表情、遮挡等综合因素影响的非限制条件下具有较好的识别效果,同时在受多种因素影响的Yale库和光照因素影响的Yale-B库上取得较高的识别率。附图说明下面结合附图和具体实施方式对本专利技术做进一步详细说明。图1为本专利技术的原理框架图。具体实施方式以下由特定的具体实施例说明本专利技术的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本专利技术的其他优点及功效。为了验证本文算法在非限制条件下的有效性,选用LFW人脸库进行人脸识别实验,同时,为进一步评估算法的性能,在限制条件下的人脸库Yale和Yale-B上进行仿真实验。实验前,所有的人脸图像经过眼睛定位、校准、剪切,最后归一化到32×32。实验硬件配置为:2.20GHz的Intel(R)Core(TM)2DuoCPU,2.00GB内存。实施例1:LFW人脸库实验:LFW中的人脸图像是用标准人脸检测器Viola-Jones从Internet上收集到的,包含5749人共13233幅图像。其中,1680人的图像数目大于或等于两幅,另外4069人只有一幅图像。图像分辨率为250×250,人脸图像以彩色为主,包含少量灰度图像。LFW主要用于非限制条件下的人脸识别,该库能充分表现真实条件下人脸图像的变化,如姿态、光照、遮挡、表情、背景、种族、性别等的变化。本申请选取图像数目大于或等于20幅的人作为实验对象,其中,包括62个人共3023幅图像。每人随机选取5幅图像作为训练样本,剩下为测试样本。1)隐藏单元数不同时算法性能:DBN对输入数据分类的准确性取决于对其自下向上、多层次学习的有效性。Hinton指出,为保证贪婪学习算法提高网络的性能,DBN各层隐藏单元的个数应保持一致,本实施例中,各层隐藏单元数相同。非限制条件下人脸图像特征复杂,且含有较多噪声,为提取人脸图像的有效特征,首先讨论不同隐藏单元数情况下本文算法性能。实验结果如表1所示。其中,训练时间是无监督预训和有监督训练的时间之和,分类时间指测试样本分类时间,总时间指训练时间和测试时间之和。值得注意的是,在进行传统LBP纹理特征作为DBN输入的实验中,当隐层单元数达到4000时,由于特征维数巨大,其对内存要求超出了本文的硬件能力范围,因而主要考虑隐藏单元数在1000到3000的情况。表1:不同隐藏单元数的正确识别率及时间消耗从表1可知,随着隐藏单元数的增加,深度网络能够更好地表达人脸图像特征,但是网络的训练时间和分类时间也随之增加,计算量逐渐增大,因而对硬件要本文档来自技高网
...
一种基于LBP和深度学校的非限制条件下人脸识别方法

【技术保护点】
一种基于LBP和深度学校的非限制条件下人脸识别方法,其特征在于,具体方法步骤如下:分别用双线性内插法将测试样本和训练样本降维至32×32,并进行直方图均衡化等归一化预处理;对训练样本和测试样本进行分块并提取每个子块的LBP纹理特征,将每个子块的特征连接起来形成样本的LBP纹理特征,其中LBP纹理特征提取时样本分块为4×5,半径R为1,像素数P为8,此时所提取的LBP 纹理特征和像素级特征维数相当;将训练样本的LBP纹理特征作为DBN可视层输入,对深度网络进行逐层训练,以获取最优网络参数,文中DBN层数选为2层:第1层学习率为0.002,迭代次数为40;第2层为0.003,迭代次数为40;当深度网络训练完后,将测试样本的LBP纹理特征作为DBN可视层输入,利用优化后的网络由下向上多层次地学习和提取测试样本的抽象特征,在网络最顶层进行SoftMax回归分类,获得测试样本的类标值,并计算正确识别率。

【技术特征摘要】
1.一种基于LBP和深度学校的非限制条件下人脸识别方法,其特征在于,具体方法步骤如下:分别用双线性内插法将测试样本和训练样本降维至32×32,并进行直方图均衡化等归一化预处理;对训练样本和测试样本进行分块并提取每个子块的LBP纹理特征,将每个子块的特征连接起来形成样本的LBP纹理特征,其中LBP纹理特征提取时样本分块为4×5,半径R为1,像素数P为8,此时所提取的LBP纹理特征和像素级特征维数相当;将训练样本的LBP纹理特征作为DBN可视层输入,对深度网络进行逐层训练,以获取最优网络参数,文中DBN层数选为2层:第1层学习率为0.002,迭代次数为40;第2层为0.003,迭代次...

【专利技术属性】
技术研发人员:徐海黎沈标刘熙田强韦勇
申请(专利权)人:南京蓝泰交通设施有限责任公司南通大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1