基于加权最大间距准则的人脸数据可分性特征提取方法技术

技术编号:16756389 阅读:30 留言:0更新日期:2017-12-09 02:32
本发明专利技术公开了一种基于加权最大间距准则的人脸数据可分性特征提取方法,主要解决已有最大间距准则MMC特征提取用非常有限的训练样本无法较为准确地估计超高维空间样本的真实散布,导致了MMC所提取的特征推广能力差,最终影响了分类的准确率的问题。其实现方案是:1)计算原始数据的类间散布矩阵Sb和类内散布矩阵Sw;2)对类间和类内散布矩阵加权,得到加权最大间距准则WMMC函数;3)最大化WMMC准则函数,得出映射矩阵;4)将原始数据映射到WMMC子空间;5)在WMMC子空间分类。本发明专利技术能在超高维小样本情况下,提取出推广能力强的可分性特征,从而提高人脸识别率,可用于超高维小样本数据的可分性特征提取。

Segmentation feature extraction method for face data based on weighted maximum spacing criterion

The invention discloses a method for extracting face data separability feature weighted maximum margin criterion based on maximum margin criterion, which mainly solves the disadvantages of MMC feature extraction can not accurately estimate high-dimensional space sample real spread with very limited training samples, the generalization ability of MMC leads to the feature extraction, and ultimately affect the accuracy the classification of the problem. The solution is: 1) scatter matrix and within class scatter matrix Sw Sb calculation of raw data between classes; 2) of the between class and within class scatter matrix weighted WMMC function weighted maximum margin criterion obtained; 3) the maximum WMMC criterion function, the mapping matrix; 4) the original data is mapped to WMMC subspace; 5) classification in WMMC subspace. The invention can extract separability features with high generalization ability under the condition of ultra-high dimensional and small samples, thereby improving the face recognition rate, and it can be applied to the separability feature extraction of ultra-high dimensional small sample data.

【技术实现步骤摘要】
基于加权最大间距准则的人脸数据可分性特征提取方法
本专利技术属于图像处理
,更进一步涉及人脸数据可分性特征提取方法,可用于超高维小样本数据的可分性特征提取。
技术介绍
近年来,人脸识别技术是一个研究的热点。人脸数据与普通数据相比,具有超高维小样本的特点。由于人脸数据维数过高,等于图像像素个数,常达几千上万维;而样本个数常为几十个,相对于维数过低,使得人脸数据处理起来比较困难。通常在采用人脸数据进行分类之前需要对原始数据进行特征提取处理,以降低维数并提高人脸识别效率,因此人脸数据的特征提取技术也越来越多。数据的可分性特征提取技术,是指通过某种变换将原始数据映射到低维特征子空间,使得数据在该低维子空间获得较好的可分性。可分性特征提取方法常用于人脸识别领域,可降低维数,提高分类识别率和分类速度。基于Fisher准则的线性判别分析LDA是经典的可分性特征提取方法,LDA将高维的原始样本投影到低维特征子空间,使得在子空间中数据的类间散布与类内散布之比最大。LDA的解为的前d个最大特征值对应的特征向量,Sw和Sb分别为原始空间数据的类内散布矩阵和类间散布矩阵。但是,对于超高维小样本数据,即训练样本数量远小于原始数据的维数时,会造成类内散布矩阵奇异,其逆矩阵不存在,使得LDA不能直接求解的前d个最大特征值对应的特征向量。为了解决LDA存在的小样本问题,最大间距准则MMC方法被提出。MMC是一种比较新的可分性特征提取方法,MMC针对小样本情况下LDA因类内散布矩阵奇异而无法求解的缺点,将目标函数更改为特征子空间中类间散布与类内散布之差最大。因此,求解MMC无需计算Sw的逆,从根本上解决了小样本情况下Fisher准则因类内散布矩阵奇异而无法求解的问题。基于MMC的人脸数据可分性特征提取方法近年来应用得越来越广泛。MMC方法与传统的LDA方法相比,可以从根本上解决小样本情况下的求解问题,基于MMC的特征提取技术也得到越来越多的应用。但是,基于MMC的人脸数据可分性特征提取方法存在的不足之处是:人脸数据的维数高达几千甚至上万维,而样本个数往往仅为几十个,采用MMC提取人脸数据特征时,仅根据目前有限的训练样本估计数据的散布,由于样本个数与数据维数相差悬殊,用非常有限的训练样本无法较为准确地估计超高维空间样本的真实散布,导致了MMC所提取的特征推广能力差,最终影响了分类的准确率。
技术实现思路
本专利技术的目的在于针对上述现有技术的不足,提出一种基于加权最大间距准则的人脸数据可分性特征提取方法,以获得推广能力高的可分性特征,提高人脸识别精度。本专利技术的技术思路是,通过将实际的数据散布考虑得更差的思想对超高维小样本人脸数据进行特征提取,认为实际的数据散布类间更聚集,类内更分散,即实际的类间散布比当前用有限的训练样本所计算的类间散布矩阵Sb反映得更小,实际的类内散布比当前用有限的训练样本所计算的类内散布矩阵Sw反映得更大。通过分别对类间散布矩阵Sb乘以小于1的权重,对类内散布矩阵Sw乘以大于1的权重,并结合MMC提出新的准则函数用于人脸数据的可分性特征提取,提取出推广能力强的可分性特征,从而提高人脸识别率。其实现步骤包括如下:(1)将给定的人脸数据集划分为训练样本和测试样本,用训练样本计算原始数据的类间散布矩阵Sb和类内散布矩阵Sw;(2)对类间散布矩阵Sb乘以小于1的权重αb,对类内散布矩阵Sw乘以大于1的权重αw,得出加权最大间距准则WMMC函数:J(W)=tr[WT(αbSb-αwSw)W],其中,tr表示矩阵的迹,即矩阵主对角线元素的和,T表示矩阵的转置,αb表示Sb的权重,αw表示Sw的权重,且0<αb≤1,1≤αw;(3)求解加权最大间距准则WMMC函数中的映射矩阵W:3a)在以W各列为基向量所支撑的特征子空间各维正交归一化作为约束条件,最大化WMMC函数,得到最优化模型:其中,wk表示W的列向量,为正交归一化约束条件,d表示特征子空间维数;3b)利用拉格朗日乘数法,对最优化模型进行求解,得到映射矩阵W,该W的各列即为WMMC所提取的人脸数据的可分性特征。本专利技术与现有的技术相比具有以下优点:1.提取出人脸数据可分性特征具有更强的推广能力。现有的超高维小样本情况下的特征提取技术,仅利用极为有限的训练样本,来估计数据的真实散布,造成所提取特征推广能力差的问题;本专利技术将实际数据的散布考虑得更差,即认为实际数据散布类间更聚集,类内更分散,从而可以在超高维小样本空间提取出推广能力更强的人脸数据可分性特征。2.提高了人脸识别精度。现有最大间距准则特征提取方法无法用训练样本的类间散布矩阵和类内散布矩阵,对超高维小样本情况下数据真实散布进行准确估计;本专利技术在超高维小样本情况下,通过对类间散布矩阵减小权重和对类内散布矩阵增大权重,实现将实际的数据散布考虑得更差,提出了新的准则函数,使得本专利技术提取出了推广能力更强的人脸数据可分性特征,从而提高了人脸识别精度。附图说明图1是本专利技术的实现流程图;图2是仿真实验中用本专利技术WMMC方法和现有MMC方法对ORL数据进行特征提取后的识别结果图。图3是仿真实验中采用本专利技术WMMC方法和现有MMC方法对Yale数据进行特征提取后的识别结果图。具体实施方式参照图1,本专利技术中基于加权最大间距准则的人脸数据的特征提取方法包括如下:步骤1,计算原始人脸数据的类间散布矩阵Sb和类内散布矩阵Sw。将原始人脸数据划分为训练样本和测试样本,用训练样本计算原始数据的类间散布矩阵Sb和类内散布矩阵Sw,其计算公式如下:其中,C表示样本的类别数,Pi表示第i类训练样本的先验概率,其通过该类训练样本个数除以总训练样本个数估计得到,即Pi=Ni/N,N表示总训练样本个数;Ni表示第i类训练样本的个数;mi表示第i类训练样本的均值向量,表示第i类的第j个训练样本;m表示训练样本的整体均值向量,步骤2,对类间和类内散布矩阵加权,得到加权最大间距准则WMMC函数。对类间散布矩阵Sb乘以小于1的权重αb,对类内散布矩阵Sw乘以大于1的权重αw,得出加权最大间距准则WMMC函数:其中,tr表示矩阵的迹,即矩阵主对角线元素的和;T表示矩阵的转置,αb表示Sb的权重,αw表示Sw的权重,且0<αb≤1,1≤αw;权重系数αb和αw的选取分三种情况:第一种情况:固定αw=1,令10-3≤αb<1,即将实际类间散布考虑得更差;第二种情况:固定αb=1,令1<αw≤103,即将实际类内散布考虑得更差;第三种情况:同时改变αb和αw,令10-3≤αb<1且1<αw≤103,即将实际类间散布和类内散布均考虑得更差。步骤3,求解加权最大间距准则WMMC函数中的映射矩阵W。3a)在以W各列为基向量所支撑的特征子空间各维正交归一化作为约束条件,最大化WMMC函数,得到最优化模型:其中,wk表示W的列向量,为正交归一化约束条件,d表示特征子空间维数;3b)利用拉格朗日乘数法,对最优化模型进行求解,得到映射矩阵W,实现步骤如下:3b1)利用拉格朗日乘数法,构造拉格朗日函数:3b2)用拉格朗日函数L(wk,λk)对wk求偏导数,令其偏导数为0,即由式<2>得到(αbSb-αwSw)wk=λkwk,则其中,λk是(αbSb-αwSw)的特征值,wk是本文档来自技高网
...
基于加权最大间距准则的人脸数据可分性特征提取方法

【技术保护点】
一种基于加权最大间距准则的人脸数据可分性特征提取方法,包括:(1)将给定的人脸数据集划分为训练样本和测试样本,用训练样本计算原始数据的类间散布矩阵Sb和类内散布矩阵Sw;(2)对类间散布矩阵Sb乘以小于1的权重αb,对类内散布矩阵Sw乘以大于1的权重αw,得出加权最大间距准则WMMC函数:J(W)=tr[W

【技术特征摘要】
1.一种基于加权最大间距准则的人脸数据可分性特征提取方法,包括:(1)将给定的人脸数据集划分为训练样本和测试样本,用训练样本计算原始数据的类间散布矩阵Sb和类内散布矩阵Sw;(2)对类间散布矩阵Sb乘以小于1的权重αb,对类内散布矩阵Sw乘以大于1的权重αw,得出加权最大间距准则WMMC函数:J(W)=tr[WT(αbSb-αwSw)W],其中,tr表示矩阵的迹,即矩阵主对角线元素的和,T表示矩阵的转置,αb表示Sb的权重,αw表示Sw的权重,且0<αb≤1,1≤αw;(3)求解加权最大间距准则WMMC函数中的映射矩阵W:3a)在以W各列为基向量所支撑的特征子空间各维正交归一化作为约束条件,最大化WMMC函数,得到最优化模型:其中,wk表示W的列向量,为正交归一化约束条件,d表示特征子空间维数;3b)利用拉格朗日乘数法,对最优化模型进行求解,得到映射矩阵W,该W的各列即为WMMC所提取的人脸数据的可分性特征。2.根据权利要求1所述的方法,其特征在于,步骤(1)中用训练样本计算原始数据的类间散布矩阵Sb和类内散布矩阵Sw,分别采用如下公式计算:其中,C表示样本的类别数,Pi表示第i类训练样本的先验概率,其通过该类训练样本个数除以总训练样本个数估计得到,即Pi=Ni/N,N表示总训练样本个数;Ni表示第i类训练样本的个数;mi表示第i类训练样本的均值向量,表示第i类的第j个训练样本;m表示训练样本的整体均值向量,3.根据权利要求1所述的方法,其特征在于,步骤(2)中加权最大间距准则WMMC函数,采用如下公式计算:

【专利技术属性】
技术研发人员:刘敬邱程程刘逸吴进刘鑫磊李梦岩张延冬
申请(专利权)人:西安邮电大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1