The invention discloses a method for extracting face data separability feature weighted maximum margin criterion based on maximum margin criterion, which mainly solves the disadvantages of MMC feature extraction can not accurately estimate high-dimensional space sample real spread with very limited training samples, the generalization ability of MMC leads to the feature extraction, and ultimately affect the accuracy the classification of the problem. The solution is: 1) scatter matrix and within class scatter matrix Sw Sb calculation of raw data between classes; 2) of the between class and within class scatter matrix weighted WMMC function weighted maximum margin criterion obtained; 3) the maximum WMMC criterion function, the mapping matrix; 4) the original data is mapped to WMMC subspace; 5) classification in WMMC subspace. The invention can extract separability features with high generalization ability under the condition of ultra-high dimensional and small samples, thereby improving the face recognition rate, and it can be applied to the separability feature extraction of ultra-high dimensional small sample data.
【技术实现步骤摘要】
基于加权最大间距准则的人脸数据可分性特征提取方法
本专利技术属于图像处理
,更进一步涉及人脸数据可分性特征提取方法,可用于超高维小样本数据的可分性特征提取。
技术介绍
近年来,人脸识别技术是一个研究的热点。人脸数据与普通数据相比,具有超高维小样本的特点。由于人脸数据维数过高,等于图像像素个数,常达几千上万维;而样本个数常为几十个,相对于维数过低,使得人脸数据处理起来比较困难。通常在采用人脸数据进行分类之前需要对原始数据进行特征提取处理,以降低维数并提高人脸识别效率,因此人脸数据的特征提取技术也越来越多。数据的可分性特征提取技术,是指通过某种变换将原始数据映射到低维特征子空间,使得数据在该低维子空间获得较好的可分性。可分性特征提取方法常用于人脸识别领域,可降低维数,提高分类识别率和分类速度。基于Fisher准则的线性判别分析LDA是经典的可分性特征提取方法,LDA将高维的原始样本投影到低维特征子空间,使得在子空间中数据的类间散布与类内散布之比最大。LDA的解为的前d个最大特征值对应的特征向量,Sw和Sb分别为原始空间数据的类内散布矩阵和类间散布矩阵。但是,对于超高维小样本数据,即训练样本数量远小于原始数据的维数时,会造成类内散布矩阵奇异,其逆矩阵不存在,使得LDA不能直接求解的前d个最大特征值对应的特征向量。为了解决LDA存在的小样本问题,最大间距准则MMC方法被提出。MMC是一种比较新的可分性特征提取方法,MMC针对小样本情况下LDA因类内散布矩阵奇异而无法求解的缺点,将目标函数更改为特征子空间中类间散布与类内散布之差最大。因此,求解MMC无需计算S ...
【技术保护点】
一种基于加权最大间距准则的人脸数据可分性特征提取方法,包括:(1)将给定的人脸数据集划分为训练样本和测试样本,用训练样本计算原始数据的类间散布矩阵Sb和类内散布矩阵Sw;(2)对类间散布矩阵Sb乘以小于1的权重αb,对类内散布矩阵Sw乘以大于1的权重αw,得出加权最大间距准则WMMC函数:J(W)=tr[W
【技术特征摘要】
1.一种基于加权最大间距准则的人脸数据可分性特征提取方法,包括:(1)将给定的人脸数据集划分为训练样本和测试样本,用训练样本计算原始数据的类间散布矩阵Sb和类内散布矩阵Sw;(2)对类间散布矩阵Sb乘以小于1的权重αb,对类内散布矩阵Sw乘以大于1的权重αw,得出加权最大间距准则WMMC函数:J(W)=tr[WT(αbSb-αwSw)W],其中,tr表示矩阵的迹,即矩阵主对角线元素的和,T表示矩阵的转置,αb表示Sb的权重,αw表示Sw的权重,且0<αb≤1,1≤αw;(3)求解加权最大间距准则WMMC函数中的映射矩阵W:3a)在以W各列为基向量所支撑的特征子空间各维正交归一化作为约束条件,最大化WMMC函数,得到最优化模型:其中,wk表示W的列向量,为正交归一化约束条件,d表示特征子空间维数;3b)利用拉格朗日乘数法,对最优化模型进行求解,得到映射矩阵W,该W的各列即为WMMC所提取的人脸数据的可分性特征。2.根据权利要求1所述的方法,其特征在于,步骤(1)中用训练样本计算原始数据的类间散布矩阵Sb和类内散布矩阵Sw,分别采用如下公式计算:其中,C表示样本的类别数,Pi表示第i类训练样本的先验概率,其通过该类训练样本个数除以总训练样本个数估计得到,即Pi=Ni/N,N表示总训练样本个数;Ni表示第i类训练样本的个数;mi表示第i类训练样本的均值向量,表示第i类的第j个训练样本;m表示训练样本的整体均值向量,3.根据权利要求1所述的方法,其特征在于,步骤(2)中加权最大间距准则WMMC函数,采用如下公式计算:
【专利技术属性】
技术研发人员:刘敬,邱程程,刘逸,吴进,刘鑫磊,李梦岩,张延冬,
申请(专利权)人:西安邮电大学,
类型:发明
国别省市:陕西,61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。