当前位置: 首页 > 专利查询>扬州大学专利>正文

一种基于分数阶稀疏表示的多视角人脸识别方法技术

技术编号:24458387 阅读:48 留言:0更新日期:2020-06-10 16:14
本发明专利技术公开了一种基于分数阶稀疏表示的多视角人脸识别方法,包括以下步骤:1输入多视角人脸图像集A和多视角测试图像集Y;2对A执行奇异值分解;3对于给定的非负分数阶参数α,计算相应的分数阶训练字典矩阵A

A multi view face recognition method based on fractional sparse representation

【技术实现步骤摘要】
一种基于分数阶稀疏表示的多视角人脸识别方法
本专利技术涉及机器学习中的分类识别领域,特别涉及一种基于分数阶稀疏表示的多视角人脸识别方法。
技术介绍
随着现代信息技术的快速发展,进行身份认证的技术转到了生物特征层面。现代生物识别技术主要是通过计算机与高科技手段密切结合,利用人体固有的生理特性和行为特征来进行个人身份的鉴定。人脸识别是基于人的面部特征信息进行的一种技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,然后再利用已有的人脸数据库,确定场景里的一个人或者多个人。目前人脸识别研究范围主要包括几个方面:人脸检测与定位、人脸特征表示、人脸识别、表情与姿态分析与分类。目前,人脸识别的研究方法有基于几何特征的方法、特征脸法、局部特征分析方法以及最新的深度神经网络方法。人脸识别系统的研究始于20世纪60年代,80年代后随着计算机技术和光学成像技术的发展得到提高,而真正进入初级的应用阶段则在90年代后期,并且以美国、德国和日本的技术实现为主。人脸识别系统成功的关键在于是否拥有尖端的核心算法,并使识别结果具有实用化的识别率和识别速度。人脸识别系统集成了人工智能、机器学习、模型理论、专家系统、视频图像处理等多种专业技术,同时需结合中间值处理的理论与实现,是生物特征识别的最新应用,其核心技术的实现,展现了弱人工智能向强人工智能的转化。高维数据的稀疏表示是近些年是机器学习和计算机视觉研究领域的热点之一,其基本假设是:自然图像本身为稀疏信号,用一组过完备基将输入信号线性表达出来,展开系数可以在满足一定的稀疏度条件下,获取对原始信号的良好近似。研究人员发现,尽管稀疏表示的优化模型是从信号重建的角度建立的,但其表示结果在模式识别中都有很好的表现,许多当前最好的分类系统往往都会选用稀疏表示作为其关键模块。基于超完备字典的信号稀疏分解是一种新的信号表示理论,其采用超完备的冗余函数系统代替传统的正交基函数,为信号自适应的稀疏扩展提供了极大的灵活性。稀疏分解可以实现数据压缩的高效性,更重要的是可以利用字典的冗余特性捕捉信号内在的本质特征。信号稀疏分解的基本思想是:使用超完备的冗余函数字典作为基函数,字典的选择尽可能地符合被逼近信号的结构,字典中的元素被称为原子。利用贪婪算法或者自适应追踪算法,从字典中找到具有最佳线性组合的很少的几项原子来表示一个信号,也称作高度非线性逼近。传统的基于稀疏表示的人脸识别方法随着人脸样本维度增大,计算代价也会随之增大,有时人脸图像不清晰或者有遮挡,会影响识别速度以及效果。
技术实现思路
本专利技术的目的是克服现有技术缺陷,提供一种基于分数阶稀疏表示的多视角人脸识别方法,通过分数阶嵌入构造人脸的训练字典矩阵,用优化方法将字典引入稀疏表示分类的框架之中,这样提取出的人脸特征不仅减少了面部的细节变化,而且消除了因遮挡引起的噪声数据,提高了人脸识别能力和稳定性。本专利技术的目的是这样实现的:一种基于分数阶稀疏表示的多视角人脸识别方法,包括以下步骤:步骤1:输入多视角人脸图像集A和多视角测试图像集Y;步骤2:对A执行奇异值分解;步骤3:对于给定的非负分数阶参数α,计算相应的分数阶训练字典矩阵Aα;步骤4:用新的分数阶训练字典求解联合稀疏表示系数矩阵X;步骤5:使用Classi(Y)公式对多视角测试图像集Y进行分类;步骤6:输出Y的人脸类别。作为本专利技术的进一步限定,步骤1中所述多视角人脸图像集A是包含了各个人脸多视角图像的训练字典,定义为:其中Ai是第i类人脸的全部图像,所述Y是一组包含M个视角的多视角测试人脸图像。作为本专利技术的进一步限定,所述步骤2具体包括:A=PΛQT,Λ=diag(λ1,λ2,...,λr),其中r是A的秩,P=(p1,p2,...,pr)和Q=(q1,q2,...,qr)分别是A的左右奇异值矩阵。作为本专利技术的进一步限定,所述步骤3具体包括:假设α是一个分数并且满足0≤α≤1,矩阵Aα是分数阶训练字典矩阵,它被定义为作为本专利技术的进一步限定,所述步骤4具体包括:将分数阶训练字典矩阵Aα嵌入到联合稀疏表示中,根据联合稀疏表示的目标函数,可以得到:其中||·||F表示矩阵的F范数,是l0和l2的混合范数,它表示在矩阵的每一行先计算l2范数,然后在结果向量上再计算l0范数,K表示稀疏度,X*表示问题(1)的最优解,采用迭代的方法求解最优化问题(1),其能被重写为:其中Xi是X的第i个行向量并且μ是正则化参数,令然后将式(3)改写成迹的形式,得到:其中tr(·)表示矩阵的迹,然后对X求导并将导数置为0,可得:X=((Aα)TAα+μΗ)-1AαY(6)。作为本专利技术的进一步限定,所述步骤5具体包括:使用如下分类规则对多视角测试图像集Y进行分类,其中Ψi(X*)表示X*中所有对应第i类的行元素均保持不变,其余元素均被设置为0。与现有技术相比,本专利技术的有益效果在于:本专利技术以基于稀疏表示的人脸识别为基础,引入了分数阶嵌入,其主要思想是先通过分数阶嵌入构造人脸的训练字典矩阵,用优化方法将字典引入稀疏表示分类的框架之中,这样提取出的人脸特征不仅减少了面部的细节变化,而且消除了因遮挡引起的噪声数据,提高了人脸识别能力和稳定性,进一步提高了用户体验。附图说明图1是本专利技术的实现流程图。具体实施方式如图1所示的一种基于分数阶稀疏表示的多视角人脸识别方法,包括以下步骤:步骤1:输入多视角人脸图像集A和多视角测试图像集Y,多视角人脸图像集A是包含了各个人脸多视角图像的训练字典,定义为:其中Ai是第i类人脸的全部图像,所述Y是一组包含M个视角的多视角测试人脸图像。步骤2:对A执行奇异值分解,A=PΛQT,Λ=diag(λ1,λ2,...,λr),其中r是A的秩,P=(p1,p2,...,pr)和Q=(q1,q2,...,qr)分别是A的左右奇异值矩阵。步骤3:对于给定的非负分数阶参数α,计算相应的分数阶训练字典矩阵Aα,假设α是一个分数并且满足0≤α≤1,矩阵Aα是分数阶训练字典矩阵,它被定义为步骤4:用新的分数阶训练字典求解联合稀疏表示系数矩阵X,将分数阶训练字典矩阵Aα嵌入到联合稀疏表示中,根据联合稀疏表示的目标函数,可以得到:其中||·||F表示矩阵的F范数,是l0和l2的混合范数,它表示在矩阵的每一行先计算l2范数,然后在结果向量上再计算l0范数,K表示稀疏度,X*表示问题(1)的最优解,采用迭代的方法求解最优化问题(1),其能被重写为:其中Xi是X的第i个行向量并且μ是正则化参数,令然后将式(3)改写成迹的形式,得到:其中tr(·)表示矩阵的迹,然后对X求导并将导数置为0,可得:X=((Aα)TAα+μΗ)-1AαY(6)。...

【技术保护点】
1.一种基于分数阶稀疏表示的多视角人脸识别方法,其特征在于,包括以下步骤:/n步骤1:输入多视角人脸图像集A和多视角测试图像集Y;/n步骤2:对A执行奇异值分解;/n步骤3:对于给定的非负分数阶参数α,计算相应的分数阶训练字典矩阵A

【技术特征摘要】
1.一种基于分数阶稀疏表示的多视角人脸识别方法,其特征在于,包括以下步骤:
步骤1:输入多视角人脸图像集A和多视角测试图像集Y;
步骤2:对A执行奇异值分解;
步骤3:对于给定的非负分数阶参数α,计算相应的分数阶训练字典矩阵Aα;
步骤4:用新的分数阶训练字典求解联合稀疏表示系数矩阵X;
步骤5:使用Classi(Y)公式对多视角测试图像集Y进行分类;
步骤6:输出Y的人脸类别。


2.根据权利要求1所述的一种基于分数阶稀疏表示的多视角人脸识别方法,其特征在于,步骤1中所述多视角人脸图像集A是包含了各个人脸多视角图像的训练字典,定义为:其中Ai是第i类人脸的全部图像,所述Y是一组包含M个视角的多视角测试人脸图像。


3.根据权利要求1所述的一种基于分数阶稀疏表示的多视角人脸识别方法,其特征在于,所述步骤2具体包括:A=PΛQT,Λ=diag(λ1,λ2,...,λr),其中r是A的秩,P=(p1,p2,...,pr)和Q=(q1,q2,...,qr)分别是A的左右奇异值矩阵。


4.根据权利要求1所述的一种基于分数阶稀疏表示的多视角人脸识别方法,其特征在于,所述步骤3具体包括:假设α是一个分数并且满足...

【专利技术属性】
技术研发人员:袁运浩张超李云强继朋
申请(专利权)人:扬州大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1