一种基于稀疏特征选择的多视角人脸识别系统技术方案

技术编号:36601631 阅读:20 留言:0更新日期:2023-02-04 18:16
本发明专利技术提供了一种基于稀疏特征选择的多视角人脸识别系统(MvDRHSFS),该框架可以通过投影矩阵从数据的多个视角中选择最具信息量的视角与特征来学习低维子空间,从而解决高维人脸图像的维度灾难问题。首先,通过F范数对投影矩阵进行约束,选择最具信息量的视角;其次,通过l21范数对投影矩阵进行行稀疏约束选择最具信息量的特征;投影矩阵与恢复矩阵采用坐标下降方式优化相互优化取得最优解,并通过投影矩阵得到测试人脸的低维空间表示。本发明专利技术弥补了现有多视角降维方法仅能单一选择视角或者特征的不足,可以同时选择最具信息量的视角与特征,从而更好的指导人脸低维子空间的学习,并进一步提升人脸识别系统的性能。并进一步提升人脸识别系统的性能。并进一步提升人脸识别系统的性能。

【技术实现步骤摘要】
一种基于稀疏特征选择的多视角人脸识别系统


[0001]本专利技术涉及人脸识别
,尤其涉及针对高维人脸图像数据的多视角低维子空间学习模型。

技术介绍

[0002]在人脸识别领域,通常数据的维度会非常高,因而带来“维度灾难问题”。进一步的,随着传感器技术的发展,可以通过不同类型的传感器采集到不同类型的人脸数据,进一步加重了维度灾难问题。因此,如何有效的学习到多视角高维人脸数据的低维子空间表示,并以此提高人脸识别系统的识别性能,成为该领域的热点研究问题。
[0003]一个最直接的处理人脸多视角高维数据的方法是将所有视角数据拼接,并送入单视角的降维方法中获得多视角数据的低维子空间表示,如主成分分析(PCA)、稀疏主成分分析(SPCA)局部保持投影(LPP)等,同时随着深度卷积神经网络的发展,还可以采用1

D卷积神经网络实现降维。但这样的做法忽略了各视角之间的特性,并且没有考虑噪声视角对低维子空间学习的副作用,往往很难取得良好的结果。
[0004]为了更好的处理人脸多视角高维空间数据,近年来发展了大量的多视角降维方法,其中最为经典的方法就是典型相关分析(CCA)。CCA致力于将两个视角投影到一个低维子空间中,在这个空间中各视角有着最大的相关性。除此之外还有多视角谱嵌入(MSE),多视角协同降维方法(McDR)等,都在学习多视角低维子空间中取得了良好的结果。然而,上述方法都存在下边两个问题:首先是在子空间学习中将所有的视角都放入学习过程中去;其次是通常对投影矩阵施加正交约束,由此限制了投影矩阵的灵活性,从而限制了子空间的辨识能力。而本专利技术可解决上述两个问题,可同时实现稀疏视角选择与特征选择,与此同时,赋予了投影矩阵更高的灵活性以学习到更好的低维子空间,由此可以学习到多视角人脸数据在低维子空间中更有效的表征。

技术实现思路

[0005]针对高维多视角人脸数据子空间学习中的噪声视角及特征问题,本专利技术利用两种不同的范数组合以实现稀疏视角选择与特征选择,进一步的,通过引入恢复矩阵放松对投影矩阵的正交约束,从而灵活的学习到多视角低维子空间,以提高人脸识别系统的识别能力。
[0006]本专利技术在优化过程中设计了一种坐标下降法来交替优化投影矩阵和恢复矩阵。首先引入两个辅助矩阵对原有的目标函数进行等价转换,使其更易求解。进一步的,针对固定恢复矩阵,将原有问题转化为仅包含投影矩阵的子问题,从而直接得到当前迭代中投影矩阵的闭解,进而固定投影矩阵,求得恢复矩阵在当前迭代的最优解。最后,测试样本可通过学习的最优投影矩阵映射到低维子空间,获取有效的特征表征。
[0007]本专利技术可以获得多视角高维空间中的低维特征表示,从而应用到不同的任务中去,如无监督聚类任务或者是有监督分类任务。通过在人脸数据集的大量实验及分析,验证
了所提方法的有效性。实验结果表明所提方法可以在无监督场景及有监督场景上取得优异的性能。
[0008]本专利技术有益的效果是:通过设计一种基于稀疏特征选择的多视角人脸识别系统,可以将噪声视角与噪声特征对多视角高维子空间学习的负面影响降至最低,同时通过放松对投影矩阵的正交约束,可以有效的提升其灵活性,从而获取更有效的低维子空间特征表征,并处理不同场景的人脸识别任务,应用广泛。
附图说明
[0009]本专利技术整体流程图见附件图1
具体实施方式
[0010]下面结合附图和实例对本专利技术作进一步介绍:
[0011]步骤1:输入数据集其中N为样本总数,X
v
为第v个视角的数据,V为视角总数,d
v
为第v个视角的维度。
[0012]步骤2:通过投影矩阵将多视角数据矩阵投影至低维子空间,同时采用F范数对投影矩阵进行组结构稀疏约束,采用的F范数为:其中是矩阵P
v
的第i行,是P
v
的第i行第j列元素。
[0013]步骤3:采用l21范数对投影矩阵进行行稀疏约束,所采用的l21范数为:
[0014]步骤4:引入恢复矩阵将低维子空间恢复至原始空间,通过最小误差的方式构造目标函数,仅对恢复矩阵R进行正交约束R
T
R=I
D
,而不对投影矩阵进行正交约束,因而使得投影矩阵学习低维子空间时更具灵活性,从而提升低维子空间的辨识能力,优化目标函数具体定义为:其中I
D
为维度为D的对角矩阵,T为矩阵转置操作,λ1、λ2分别为两个非负正则参数,用以控制两个范数的惩罚强度。
[0015]步骤5:该目标函数的求解优化可以通过坐标下降法解决,首先通过引入两个辅助矩阵A和B对(3)进行等价转化:
其中,diag()为对应矩阵的对角元素,ε是一个无穷小的数。
[0016]针对问题(4),固定投影矩阵P优化恢复矩阵R:对问题(4)针对P求偏导并使其为0,可得:由(6)可以得到P在当前迭代的闭解:P=(X
T
X+λ1A+λ2B)
‑1X
T
XR
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0017]固定投影矩阵P优化恢复矩阵R:当P固定时,问题(4)可以变为:则R的最优解为R=U

V

T
,其中U

、V

T
由SVD分解得到,即X
T
XP=U

ΣV

T

[0018]步骤6:测试未知数据,一旦学习得到投影矩阵P,可以通过(9)得到测试样本的低维空间表示Z:Z=XP
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(9)并进一步应用至无监督场景、有监督场景的不同下游任务,即采用谱聚类方法获得聚类结果,或者采用最近邻方法获得分类结果。实验设计
[0019]实验数据集选取:实验选择人脸数据集ORL进行实验。ORL包含40个测试者,每个测试者各取10张不同角度的灰度人脸图像,共400张。针对灰度图像,进一步的提取LBP特征(3304维),Gabor特征(6750维),联合原始的像素强度(4096维)特征形成高维多视角数据集。
[0020]我们将子空间的维度D的搜索范围设置为[35,50,100,160,200],将两个正则参数λ1、λ2的搜索范围分别设置为[0.05,0.1,0.2,0.4,0.8,1.6,3.2,6.4,10,100]和[0.01,0.1,1,10,100]。所有的实验都在搭载Xeon E5

2620 CPU,64GB内存,Windows Server 2012R2系统和MATLAB上完成。
[0021]对于无监督聚类任务,随机选取80%用以训练,剩余样本用于调节参数以获取最优性能。对于有监督分类任务,随机选取不同比例的样本用以训练,剩余样本用以测试。所有结果均为独立实验30次后的平均结果。
实验结果
[0022]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于稀疏特征选择的多视角人脸识别系统,其特征在于:具体步骤是:1)预处理:将采集的人脸图像通过提取多种不同类型的特征生成数据矩阵其中d
v
是第v个视角的维度,N是样本总数,V是视角总数;2)训练第一步:引入投影矩阵以将数据矩阵投影至低维子空间中,同时采用F范数对投影矩阵进行组结构稀疏约束以便对数据矩阵进行视角选择,其中D是低维子空间维度,是第v个视角对应的投影子矩阵;3)训练第二步:采用l21范数对投影矩阵进行行稀疏约束以便对数据矩阵进行特征选择;4)训练第三步:引入恢复矩阵将低维子空间恢复至原始空间,通过最小误差的方式构造目标函数;5)训练第四步:采用坐标下降法的方式分别对投影矩阵和恢复矩阵进行优化求解;6)测试:通过学习到的投影矩阵对测试样本进行投影得到测试人脸的低维特征表示,并应用到不同的下游任务中。2.根据权利要求1所述的一种基于稀疏特征选择的多视角人脸识别系统,其特征在于:所述的训练第一步通过投影矩阵将多视角数据矩阵投影至低维子空间,同时采用F范数对投影矩阵进行组结构稀疏约束,采用的F范数为:其中是矩阵P
v
的第i行,是P
v
的第i行第j列元素。3.根据权利要求1所述的一种基于稀疏特征选择的多视角人脸识别系统,其特征在于:所述训练第二步采用l21范数对投影矩阵进行行稀疏约束,所采用的l21范数为:4.根据权利要求1所述的一种基于稀疏特征选择的多视角人脸识别系统,其特征在于:训练第三步,引入恢复矩阵将低维子空间恢复至原始空间,通过最小误差的方式构造目标函数,仅对恢复矩阵R进行正交约束R
T
R=I
D
,而不对投影矩阵进行正交约束,因而使得投影矩阵学习低维子空间时更具灵活性,从而提升...

【专利技术属性】
技术研发人员:王喆李冬冬郭威杨海
申请(专利权)人:华东理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1