当前位置: 首页 > 专利查询>深圳大学专利>正文

基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统技术方案

技术编号:15725136 阅读:90 留言:0更新日期:2017-06-29 12:43
本发明专利技术提供了一种基于核非负矩阵分解(KNMF)的字典学习和稀疏特征表示的人脸识别方法及系统,该人脸识别方法包括将个类预设的非负训练样本图像表示为非负列向量,并组合成

【技术实现步骤摘要】
基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统
本专利技术涉及人脸识别
,尤其涉及基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统。
技术介绍
近年来,在计算机视觉与模式识别领域中,人脸识别已经成为最热门的研究方向之一。人脸识别系统被广泛地应用于我们的生活当中,例如公安刑侦破案、门禁系统、摄像监视系统、身份辨识、网络应用等。人脸识别服务于人们活动的各个重要方面,给人们带了便利、轻松的生活环境。人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。在人脸识别当中,表示一张人脸图像最流行的方法是通过一组基图像的线性组合。非负矩阵分解(NMF)是一种典型的人脸识别方法,能够有效地提取人脸的局部化特征。对于一个非负矩阵X,NMF是为了找到两个非负矩阵W和H使得X≈WH,其中W和H分别被称为基图像矩阵和系数矩阵。W的每一列被叫作基图像,这些基图像是一些人脸的局部化特征,比如说鼻子、眼睛、耳朵、嘴巴等等。H的每一列是一个特征,这些特征是由非负的系数组成。如果X的每一列代表一张人脸图像,那么NMF能通过W中的局部化特征的线性组合来学习X中的每一整张人脸图像,这与通过组合物体部分来形成总体这一直观概念相符合。然而,非负矩阵分解算法是一种线性特征提取方法。由于人脸图像受到不同光照、不同姿势、不同表情等因素的影响,人脸图像的数据在模式空间中分布十分复杂,往往呈现出非线性结构,所以,当我们应用线性的算法(比如NMF)到人脸识别上时,就很难取得比较好的识别效果。为此,许多研究人员提出了一些非线性方法来克服这类问题。其中,核方法是一种流行的方法,它能够有效地提取模式的非线性特征,从而克服人脸图像数据呈现的非线性问题。核方法的基本思想是首先通过利用非线性映射φ将原始空间中的数据X映射到一个高维核空间中,使得新的数据φ(X)线性可分,然后在高维核空间中应用线性方法对新的数据φ(X)进行处理。在核方法中,核空间的维数一般远大于原始样本空间的维数,甚至有些是无穷维。作为一种非线性的方法,核非负矩阵分解(KNMF)是NMF的核方法,它克服了图像数据非线性问题。KNMF算法的主要思路是首先将通过非线性映射后的样本φ(X),然后用高维核空间中的一组基近似地线性表出φ(X),即φ(X)≈φ(W)H,系数矩阵H的每一列将作为原始样本X的新特征。在人脸识别上,实验结果表明KNMF优于线性NMF方法。研究表明,提取的特征越稀疏,越有利于模式分类。因此,在人脸识别上,一些具有稀疏特征的非负矩阵分解算法被提出用来提高算法的识别性能。为了提高KNMF特征的稀疏度和判别力度,我们前面工作提出了一种分块核非负矩阵分解算法(BKNMF)。BKNMF通过利用了分块技巧,首先是对每一类的训练样本执行一种核非负矩阵分解,然后合并所有类的分解得到总的分解。在BKNMF执行的核非负矩阵分解与KNMF有所不同,前者通过利用每类的判别信息来减小类间的距离,因此比后者有更好的判别力度。BKNMF能够提取稀疏的非线性特征,并且来自不同类的特征是相互正交的。但是BKNMF的特征稀疏度还可以进一步提高,从而使识别性能提升。非负稀疏表示(NSR)方法是提取非负稀疏特征的有效方法。NSR的主要任务是解决一个带有l0范数正则项的平方最小化问题。然而,这个最小化问题是一个NP难度问题。幸运的是,对非负稀疏表示的深入研究表明:当这个NP难度问题的解充分稀疏时,它能够用l1范数正则项代替l0范数正则项,从而转化成一个带有l1范数正则项的凸优化问题。当数据呈现出非线性结构时,非线性的NSR通常比线性的NSR取得的分类会效果更好。作为一种非线性的NSR方法,基于核的非负稀疏表示(KNSR)有效地克服了数据呈非线性结构问题。KNSR的关键在于其稀疏学习字典,一般直接用映射后的训练样本矩阵作为稀疏表示字典,基于该字典在高维核空间中来提取新数据的非负稀疏特征。虽然KNSR能够提取数据的稀疏非线性特征,但是它的字典没有利用到模式的类标信息,即它是一种无监督的方法。因此,KNSR的性能在分类任务中会受到影响。本专利拟通过利用训练样本的类标信息来构造高性能稀疏学习字典,以提升KNSR的识别性能。总之,在人脸识别中,虽然有各种各样方法被提出来克服各种问题,但是这些现有的方法都普遍存在一些问题:(1)当数据在模式空间中呈非线性分布时,线性算法的效果并不理想;(2)许多算法都是无监督的方法,即没有用到样本的类标信息,通常有监督的方法都会比无监督的方法取得的效果好;(3)许多方法提取的特征不足够稀疏,这会降低算法分类能力。关键词解释:1,非负矩阵分解(NonnegativeMatrixFactorization,NMF)非负矩阵分解是将一个非负样本矩阵X近似分解成两个非负矩阵的乘积,即X≈WH,其中,W和H都是非负矩阵且分别被称为基图像矩阵和系数矩阵。2,核非负矩阵分解(KernelNonnegativeMatrixFactorization,KNMF)核非负矩阵分解是首先通过一个非线性映射φ将非负样本矩阵X映射到高维空间中,然后将被映射的非负样本矩阵φ(X)近似分解成被映射的原像矩阵φ(W)和系数矩阵H,的乘积,即φ(X)≈φ(W)H,其中W和H都是非负矩阵且分别被称为原像矩阵和系数矩阵。3,分块核非负矩阵分解(BlockKernelNonnegativeMatrixFactorization,BKNMF)在BKNMF中,非负样本矩阵X是由c类非负训练样本生成,即X=[X1,X2,...,Xc],其中Xi是由第i类非负训练样本组成,(i=1,2,...,c)。分块核非负矩阵分解首先是对每一个小矩阵φ(Xi)进行分解,即φ(Xi)≈φ(Wi)Hi,其中Wi和Hi都是非负矩阵。通过组合以上所有分解,即可得到如下分块核非负矩阵分解:φ(X)≈φ(W)H,其中,φ(X)=[φ(X1),φ(X2),...,φ(Xc)],W=[W1,W2,...,Wc],φ(W)=[φ(W1),φ(W2),...,φ(Wc)],H=diag{H1,H2,...,Hc}.4,基于核的非负稀疏表示(Kernel-basedNonnegativeSparseRepresentation,KNSR)基于核的非负稀疏表示是首先通过一个非线性映射φ将非负列向量y和非负样本矩阵X映射到高维空间中,直接用X的像矩阵作为稀疏学习字典,在此字典下找到一个尽可能稀疏的非负向量s来表达φ(y),即φ(y)≈φ(X)s,其中φ(X)被称为稀疏学习字典,非负列向量s被要求含有尽可能多的零元素。具体说明如下:1、非负矩阵分解算法(NMF)NMF算法的主要思想是:对于一个给定的非负样本矩阵X=[x1,x2,...,xn]找到两个非负矩阵W和H使得:X≈WH,其中,W=[w1,w2,...,wr],且W与H都是非负矩阵且分别被称为基图像矩阵和系数矩阵。那么,对于X中的第i张人脸图像(第i列)xi,可被W中的基图像近似地线性表示成其中wk是W中的第k张基图像(第k列),hki是特征hi中第k个非负系数。为了度量X与WH的逼近程度,NMF算法的目标函数被定义为:则NMF需要求解如下优化问题:如上问题可用梯度下降法解决,可得本文档来自技高网...
基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及系统

【技术保护点】
一种基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法,其特征在于,包括如下步骤:A.将c个类预设的非负训练样本图像表示为非负列向量,然后组合成非负小矩阵X

【技术特征摘要】
1.一种基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法,其特征在于,包括如下步骤:A.将c个类预设的非负训练样本图像表示为非负列向量,然后组合成非负小矩阵Xi;B.对每一个小矩阵Xi执行KNMF,来得到非负原像子矩阵Wi,然后组合成非负原像矩阵W=[W1,W2,...,Wc];C.对于一个非负的测试样本y,通过更新法则(6)来获得y的稀疏表示特征s;D.将s表示成其中si是一个列向量,它表示s中只与φ(Wi)有关的部分;E.计算每一个di=||si||1;F.比较所有的di,如果dk是最大,那么将y归到第k类。2.根据权利要求1所述的人脸识别方法,其特征在于,该人脸识别方法包括利用分块策略构造一个有监督的基于核非负矩阵分解的稀疏学习字典。3.根据权利要求2所述的人脸识别方法,其特征在于,构造基于核非负矩阵分解的字典包括:利用类标信息,对每一类的非负训练样本矩阵Xi执行KNMF,(i=1,2,...,c),即φ(Xi)≈φ(Wi)Hi,其中Wi和Hi都是非负矩阵,通过合并所有类别的分解,我们得到总得分解:即φ(X)≈φ(W)H,其中φ(X)=[φ(X1),φ(X2),...,φ(Xc)],W=[W1,W2,...,Wc],φ(W)≈[φ(W1),φ(W2),...,φ(Wc)],H=diag{H1,H2,...,Hc};φ(W)是有监督的基于核非负矩阵分解的稀疏表示字典。4.根据权利要求3所述的人脸识别方法,其特征在于,根据稀疏表示字典来学习样本的非负稀疏表示特征,其通过解决一个带有l1范数正则项的平方最小化问题来得到。5.根据权利要求4所述的人脸识别方法,其特征在于,基于稀疏表示字典φ(W),对于一个非负测试样本y的稀疏表示特征通过解最优化问题(3)得到:其中λ是一个非负的正则化参数,||s||0表示s中非零元素的个数,当问题(3)的解充分的稀疏时,问题(3)中l0范数可以用l1范数代替,从而转化为一个带有l1范数正则项的凸优化问题来求解,那么可以将等式(4)写成:其中||s||1表示s中所有元素的和。基于梯度下降法,则有:其中ρ是一个非负的步长向量,是F(s)关于向量s的偏导数且其中1是元素全为1的列向量,为了保持s的非负性,令最后我们得到了关于s的如下迭代公式来解决问题(3):在更新法则(6)下,F(s)是收敛的。6.一种基于核非负矩阵分解的字典学习和...

【专利技术属性】
技术研发人员:陈文胜李育高潘彬彬陈波
申请(专利权)人:深圳大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1