基于拓扑保持的解析型字典学习模型的人脸识别方法技术

技术编号:15895777 阅读:117 留言:0更新日期:2017-07-28 20:02
本发明专利技术公开了一种基于拓扑保持的解析型字典学习模型的人脸识别方法,包括:首先对训练集和测试集样本进行预处理,对训练集和测试集样本进行映射,每张图像都得到一个对应的随机脸特征列向量;优化学习得到解析型字典Ω:获得训练集和测试样本的编码系数:将测试样本的编码系数、训练集的编码系数及其对应的类别标签信息一起输入分类器,得到最终分类结果。本发明专利技术针对后两个环节,尤其是第3个环节的分类模型,进行了有益创新。本发明专利技术提出一种基于拓扑保持的解析型字典学习模型的人脸识别方法,将人脸特征的结构信息与判决信息放在一个统一的解析型字典学习框架下学习,使得最终的人脸识别准确率与运行速度均得到明显提高。

Face recognition method based on topological preserving analytic dictionary learning model

The invention discloses a learning model analytical dictionary based on topology preservation method of face recognition, including: firstly, the training set and test set of sample pretreatment, the training set and test set samples for each image mapping, random face features a corresponding column vector; the optimized Analytical Dictionary. Study: encoding coefficient obtained in the training set and the test sample: the test sample encoding coefficient, encoding coefficient of training set and the corresponding class labels information input classifier to get the final classification result. The invention carries out beneficial innovation aiming at the classification model of the latter two links, especially the third links. The invention provides a learning model analytical dictionary based on topology preservation method of face recognition, the structure information and decision information of facial features in a unified analytical dictionary learning under the framework of learning, making the recognition accuracy and speed are significantly improved.

【技术实现步骤摘要】
基于拓扑保持的解析型字典学习模型的人脸识别方法
本专利技术涉及计算机视觉、模式识别、生物特征识别等
,特别涉及一种基于拓扑保持的解析型字典学习模型的人脸识别方法(TopologyPreservingAnalysisDictionaryLearning,简称TP-ADL)。
技术介绍
生物特征识别技术是使用人体的某些生物特性来对个体的身份进行识别的先进技术。因为每个人的生物特征都是不同的,而且不会轻易改变,满足个体识别的条件。这种技术通常采用的方法是先对个体采取某个或某些生物特征,然后将其与已有数据库中的样本进行比较,判断是否符合。与传统的以证件、密码等为对象的识别技术相比,以人脸识别为代表的生物特征识别技术可以做到不与识别人发生任何肢体接触,可以不惊动对象,只需要采用一般的摄像头就可以采集,成本很低,因此人脸识别技术成为众多学者们重点研究的对象之一。人脸识别的研究始于20世纪60年代,并且随着计算机硬件和网络的发展,在几十年中取得了长足的进步。人脸识别技术正在视频监控、证件验证、刑侦破案等社会生活的诸多方面发挥着巨大作用。常规的人脸识别技术主要包含2个主要过程,即训练过程和测试过程。训练过程有3个处理环节,分别是训练图像预处理、训练图像特征的提取、分类模型的建立。测试过程有3个处理环节,分别是测试图像预处理、测试图像特征的提取、使用训练阶段得到的分类模型对测试图像进行分类预测。如果要改进人脸识别技术,提升识别准确度,可以对人脸图像预处理的方法进行改进,也可以对提取人脸图像特征的方法进行创新,还可以选择适合人脸图像特征的分类模型和分类算法。如何增加各环节处理方法的适用性,即不断改进这些处理算法以改善分类方法的整体性能,这仍是目前人脸识别研究领域的重点。稀疏表示理论与人脸识别的结合是近些年被提出的。稀疏表示理论是将待预测的图像用训练集中的图像进行线性组合表示,然后对线性组合的系数进行分类判决,达到预测其类别的目的。与主成分分析(PCA)等传统方法不同,稀疏表示是基于I0或I1范数的求解过程,重点是找到线性组合的系数即待测人脸图像的稀疏编码。这种思路与之前的人脸识别方法有很大的不同,而且稀疏表示理论的优点在于对于面部有掩盖的情况下,可以有更好的分辨效果,因此这种理论在人脸识别中的应用受到越来越多的学者的关注。稀疏表示理论的中心思想是:首先构造一个过完备字典,其中包含足够的具有代表性的样本,然后对于任意一个样本(一般是一个向量),用这个字典中少数几个样本来线性加和表示,这样就可以得到一个非零元素很少的编码向量,达到稀疏表示的目的。稀疏编码的性能在很大程度上依赖于字典的学习,在稀疏表示应用到人脸识别的初期,大多是用预设的固定字典,如:训练集特征组成的字典、Curvelet基组成的字典、Gabor基组成的字典等,这样的字典在不同数据集上的重构效果不一,对不同数据集的识别准确率也波动很大。因此,一个根据训练数据集自适应学习得到的字典往往比预设的固定字典更加符合人脸识别的需求。如今已有很多优秀算法来快速学习一个过完备字典,但是最初提出的传统字典学习模型并不是应用于分类识别的,而是应用于信号重构的相关问题。为了利用字典学习解决人脸识别问题,研究者们提出了两类方法,这些方法将传统的字典学习修正为满足人脸识别需求的监督字典学习:一类是直接学习具有判决力的字典,另一类是使稀疏编码具有区分性,继而使得到的字典具有判决力。前者主要是利用重构误差来进行最终的人脸识别,后者主要是利用稀疏表示系数作为新的特征用于分类识别。然而,学者们为解决分类识别问题而提出的多种监督字典学习模型都是学习一个综合型字典,在学习阶段需要求解基于线性加和表示的合成编码过程。这种编码过程在求解时使用迭代的方式进行,非常耗时,严重影响了人脸识别的实际使用。此外,这些监督字典方法过于强调编码的稀疏性在分类识别任务中的作用,忽视了在原始特征数据中蕴含的结构信息,而这些结构信息往往对于分类模型的识别准确率有很大的影响。作为字典学习的另外一个主流方向,解析型字典学习模型引起了国内外学者的高度关注。解析型字典是综合型字典的对偶形式,它的目标不是学习一组用于线性加和表示的基,而是学习一个映射矩阵,使得信号映射以后的表示是稀疏的。解析型字典学习模型具有良好的信号表示能力,但目前国内外的研究仅仅停留在解析型字典对信号进行重构的应用上。
技术实现思路
本专利技术的目的是提出一种基于拓扑保持的解析型字典学习模型的人脸识别方法,以解决传统的基于稀疏表示和字典学习的人脸识别方法对图像结构信息和判决信息利用不够充分、学习过程的时间复杂度较高等问题。为了实现本专利技术的目的,本专利技术提供了一种基于拓扑保持的解析型字典学习模型的人脸识别方法,步骤S1,为了方便操作,首先对训练集和测试集样本进行预处理,中心裁剪得到w×h的像素部分,然后用随机矩阵对训练集和测试集样本进行映射,每张图像都得到一个对应的随机脸特征列向量;步骤S2,优化学习得到解析型字典Ω:按照提出的拓扑保持的解析型字典学习模型对训练集数据建模,通过两步交替迭代的优化方式最小化目标函数,学习解析型字典Ω和编码系数X;步骤S3,获得训练集和测试样本的编码系数:用训练好的解析型字典Ω根据x=Ωy对训练集和测试样本同时进行编码;步骤S4,将测试样本的编码系数、训练集的编码系数及其对应的类别标签信息一起输入分类器,得到最终分类结果。其中,在步骤S1中,对训练集和测试集样本进行相同的中心裁剪,将获得的图像拉伸成列向量,然后用随机矩阵对训练集和测试集样本的列向量进行映射,其中:随机矩阵每个元素都是先独立取样于零均值的正态分布,再将其每行都标准化到单位长度。其中,在步骤S2中,求解模型为:上述目标函数中:α,β为人工设置的权重参数,用于调节各项之间的相对大小关系;其中,第一部分是基本的解析型字典学习模型:其中,代表稀疏重构误差,ωi是解析型字典Ω的第i行。其中,第二部分Tr(ΩYLYTΩT)是拓扑保持项,拓扑保持需要保持的是影响k近邻(kNN)分类性能的原始特征的相对远近程度(近邻排序),原始空间任意两个特征向量yu和yv的距离设为suv,编码空间对应的距离设为tuv,拓扑保持目标函数为:其中:矩阵Si为反对称矩阵,其位置(u,v)的元素值是原始空间两个距离的差siu-siv,利用反对称矩阵的性质,对公式(3)进行化简,可得:可令Wij∑uSi(u,j),则公式(4)可继续化简为:此处的矩阵W即可看作一个权重矩阵(W不对称,但是可以分解成对称矩阵W+与反对称矩阵W-的加和),可以求取L=S+-W+,其中S+矩阵定义为对角阵,第i个对角元素值S+,ii等于W+矩阵的第i行所有元素的和,由此,可以推导得到拓扑保持项的拉普拉斯矩阵形式的约束:为了同时保持近邻特性,我们采取以下方式为每个yi计算Wij:其中N(yi)是yi的k近邻集合,考虑到解析型字典在编码过程中的重要性,也为了更直接的学习字典Ω,我们将公式(6)中的X替换为ΩY,继而得到拓扑保持项的最终形式;第三部分是判决强化项,设置r等于样本的类别总数,矩阵的每一列为仅有1个非零元素的列向量,其非零元素的位置就对应于训练样本的类别信息。其中,在步骤S2中,目标函数(1)是非凸问题,考虑求解它的凸本文档来自技高网
...
基于拓扑保持的解析型字典学习模型的人脸识别方法

【技术保护点】
一种基于拓扑保持的解析型字典学习模型的人脸识别方法,其特征在于,该方法包括:步骤S1,为了方便操作,首先对训练集和测试集样本进行预处理,中心裁剪得到w×h的像素部分,然后用随机矩阵

【技术特征摘要】
1.一种基于拓扑保持的解析型字典学习模型的人脸识别方法,其特征在于,该方法包括:步骤S1,为了方便操作,首先对训练集和测试集样本进行预处理,中心裁剪得到w×h的像素部分,然后用随机矩阵对训练集和测试集样本进行映射,每张图像都得到一个对应的随机脸特征列向量;步骤S2,优化学习得到解析型字典Ω:按照提出的拓扑保持的解析型字典学习模型对训练集数据建模,通过两步交替迭代的优化方式最小化目标函数,学习解析型字典Ω和编码系数X;步骤S3,获得训练集和测试样本的编码系数:用训练好的解析型字典Ω根据x=Ωy对训练集和测试样本同时进行编码;步骤S4,将测试样本的编码系数、训练集的编码系数及其对应的类别标签信息一起输入分类器,得到最终分类结果。2.根据权利要求1所述的基于拓扑保持的解析型字典学习模型的人脸识别方法,其特征在于,在步骤S1中,对训练集和测试集样本进行相同的中心裁剪,将获得的图像拉伸成列向量,然后用随机矩阵对训练集和测试集样本的列向量进行映射,其中:随机矩阵每个元素都是先独立取样于零均值的正态分布,再将其每行都标准化到单位长度。3.根据权利要求1所述的基于拓扑保持的解析型字典学习模型的人脸识别方法,其特征在于,在步骤S2中,求解模型为:s.t.||X||0≤T0,||ωi||2=1,i=1,2,L,r上述目标函数中:α,β为人工设置的权重参数,用于调节各项之间的相对大小关系;其中,第一部分是基本的解析型字典学习模型:s.t.||X||0≤T0,||ωi||2=1,i=1,2,L,r(2)其中,代表稀疏重构误差,ωi是解析型字典Ω的第i行。其中,第二部分Tr(ΩYLYTΩT)是拓扑保持项,拓扑保持需要保持的是影响k近邻(kNN)分类性能的原始特征的相对远近程度(近邻排序),原始空间任意两个特征向量yu和yv的距离设为suv,编码空间对应的距离设为tuv,拓扑保持目标函数为:其中:矩阵Si为反对称矩阵,其位置(u,v)的元素值是原始空间两个距离的差siu-siv,利用反对称矩阵的性质,对公式(3)进行化简,可得:可令Wij∑uSi(u,j),则公式(4)可继续化简为:

【专利技术属性】
技术研发人员:赫然谭铁牛孙哲南郭君曹冬
申请(专利权)人:天津中科智能识别产业技术研究院有限公司
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1