当前位置: 首页 > 专利查询>江南大学专利>正文

一种利用特征信息的加权典型相关分析方法技术

技术编号:15437957 阅读:246 留言:0更新日期:2017-05-26 03:57
本发明专利技术公开了一种利用特征信息的加权典型相关分析方法,主要解决传统典型相关分析丢失特征信息指导,无法凸出重要特征与次要特征的区别的问题。该方法首先对输入的两组特征集中的各个特征进行特征方差的计算,并利用计算出的方差对原始特征进行加权处理,然后利用加权后的特征数据集进行典型相关分析的特征抽取,得出多组特征投影向量,并计算出各个投影向量所对应的典型相关性系数,接着利用该典型相关性系数对每个投影向量进行加权处理,组合成最终的加权典型相关分析的投影集,最后根据得到的加权典型相关分析的投影集进行特征抽取,应用于以后的模式识别任务。本发明专利技术方法能有效增强提取出来的特征的表现力和鉴别性,从而有效地提高基于典型相关分析的人脸识别和图像分类等算法的识别精度。

A weighted canonical correlation analysis method using feature information

The invention discloses a weighted method of canonical correlation analysis using feature information, mainly to solve the traditional canonical correlation analysis of missing feature information guide, cannot distinguish the important features and characteristics of the secondary convex problem. Calculation of the various features of the method first two sets of features on the input concentration feature variance, and weighted processing of the original character by using the calculated variance, and then use the weighted feature data set after feature extraction of typical correlation analysis, the multi group feature projection vector, and calculate the correlation coefficient corresponding to typical each projection vector, then using the canonical correlation coefficients are weighted for each projection vector projection, weighted canonical correlation analysis combined into the final set, finally extracts the features set according to the weighted projection of canonical correlation analysis, pattern recognition tasks used in the future. The method of the invention can effectively enhance the expressive force and the discrimination of the extracted features, so as to effectively improve the recognition accuracy of the algorithms such as face recognition and image classification based on canonical correlation analysis.

【技术实现步骤摘要】
一种利用特征信息的加权典型相关分析方法
本专利技术属于模式识别和图像处理
,主要涉及在多视图条件下抽取一种具有表现力和鉴别性的融合特征方法;具体地说是一种利用特征信息的加权典型相关分析方法,可用于模式识别、机器学习、数据挖掘、图像处理、天气预测和医疗卫生等领域。
技术介绍
在模式识别和机器学习领域,同一对象能够获取多组特征信息,这些特征信息能够从各个方面有效地表示该对象的属性特征。例如,人脸特征能够由肤色、形状、眼睛、发色等信息组成,一个网页属性包含网页文本、超链接、域名、标题等信息。但对于多组特征的学习,经典的单视图学习方法,如主成分分析(Principalcomponentanalysis,PCA),并不能有效地抽取出完备的特征。因此,对多组特征的信息融合算法是非常有意义的,多视图学习也成为模式识别领域研究的热点之一。典型相关分析(Canonicalcorrelationanalysis,CCA)是一种经典的多视图学习方法,主要研究同一对象的两组变量之间的关系。与单视图的PCA不同,CCA通过最大化两组线性组合后的特征的相关性,提取出多组典型相关特征。现在,CCA被用于模式识别、图像处理、机器视觉、医疗卫生、天气预测等许多领域的信息融合。偏最小二乘(Partialleastsquares,PLS)是另一种经典多视图学习方法,其主要目的是最大化特征之间的变异性及相关性。Borga基于Rayleigh商和广义特征值问题建立了CCA与PCA、多元线性回归(Multvariatelinearregression,MLR)以及PLS的统一模型。Sun等人首次将CCA用于模式识别领域(SunQS,ZengSG,LiuY,etal.Anewmethodoffeaturefusionanditsapplicationinimagerecognition[J].PatternRecognition,2005,38(12):2437-2448.),并获得满意的实验结果。但CCA从本质上来讲是一种线性子空间学习方法。对于全局非线性的情况下,CCA并不能提取有表现力的典型相关特征。因此,S.Akaho等人将核技术引进CCA,将原始空间中的特征扩展到更高维度空间中,提出核典型相关分析(Kernelcanonicalcorrelationanalysis,KCCA)(S.Akaho.Akernelmethodforcanonicalcorrelationanalysis[C].In:InternationalMeetingofPsychometricSociety,2006.)。CCA的求解需要转化为对应的广义特征值求解,在模式识别中,对高维样本的不充分采样会导致高维小样本问题,CCA的协方差矩阵极有可能奇异,导致算法的性能降低。而且传统CCA对于每个特征都是公平对待,小样本问题带来重要特征与次要特征无法区分的弊端,提取出来的典型相关特征没有表现力和鉴别性。为了克服小样本问题,Xing等人提出一种完备的典型相关分析(Completecanonicalcorrelationanalysis,C3A)(XiangleiX,KejunW,TaoY,etal.Completecanonicalcorrelationanalysiswithapplicationtomulti-viewgaitrecognition[J].PatternRecognition,2016,50:107-117.),通过矩阵分解,提取出完整的典型相关特征,实验结果显示,C3A能够保留完整的特征信息,算法的识别率得到提高。另外,LeAn等人提出了一种新颖的鲁棒典型相关分析(Robustcanonicalcorrelationanalysis,ROCCA)(LeAn,SongfanYang.PersonRe-IdentificationbyRobustCanonicalCorrelationAnalysis[J].IEEESignalProcessingLetters,2015,22(8):1103-1107.),利用一个近似矩阵代替奇异的协方差矩阵进行广义特征值分解,实验结果显示ROCCA能够提高算法的鲁棒性,识别效果得到提高。但以上CCA的改进算法都忽视了特征的重要性,未能区分重要特征与次要特征对算法性能的影响。
技术实现思路
针对上述问题,本专利技术提出一种利用特征信息的加权典型相关分析方法(Weightedcanonicalcorrelationanalysis,WCCA),以解决传统典型相关分析及其改进算法未能考虑重要特征和次要特征对特征抽取过程的影响的问题,能够合理利用样本特征所带有的信息,提取出更加具有表现力和鉴别性的特征,用于模式识别和图像处理的任务,能够有效地提高算法在人脸识别和图像分类时的精确度。实现本专利技术的关键技术是:充分利用样本固有的一些特征信息,如特征的方差信息和相关性信息,首先在原始样本特征层面,利用原始样本特征的方差信息对原始特征进行加权处理,使在特征融合过程能够充分利用重要特征信息,降低次要特征信息对特征抽取的影响;然后采用提取之后的典型相关变量所带有的相关性信息,对所对应的典型相关投影向量进行加权处理,凸出相关性较大的典型相关变量;最后利用加权后的典型相关投影向量对样本特征集进行特征抽取,并采用串型组合特征的方式组合多视图下的特征用于接下来的模式识别任务中。为实现上述目标,具体实现步骤如下:(1)给定一组大小为N且已经中心化处理后的样本对作为输入数据集:(2)重新描述数据集X和Y,如下:X=[a1,a2,...,ap]T,Y=[b1,b2,...,bq]T,其中,和分别是X和Y的第i个特征的特征向量;(2.1)计算各个特征对应的特征方差λi=var(ai),i=1,2,...,p,μi=var(bi),i=1,2,...,q;(2.2)利用λi和μi对原始特征数据集X和Y进行加权处理,得到处理后的特征数据集和(3)由和计算协方差矩阵和互协方差矩阵(4)求解如下的目标函数:得到投影向量集d为选取的特征投影向量的个数,表示前d大相关性的特征投影向量集,并计算得到αi和βi对应的相关性系数ρi;(5)根据相关性系数ρi对和进行加权,并组合到加权后的投影向量集和利用和提取特征后,采用串联特征的方式进行特征的组合,如下:接着用于后续的模式识别任务中。本专利技术方法具有如下优点:(1)本专利技术充分考虑了特征所固有的信息,而且特征的方差和相关性信息在模式识别领域具有较强的表现力,这不仅克服了传统典型相关分析无法区别对待重要特征和次要特征的贡献,而且在特征的方差和相关性指导下,提取出来的特征更加具有表现力和鉴别性。(2)本专利技术能够考虑到样本采集受外界因素的影响,例如光照、姿态、旋转、遮挡等,在特征抽取的过程中能够通过调节因子来抑制外界因素对特征的影响,与传统典型相关分析同等对待各个特征相比,本专利技术抽取后的特征更能反映原始样本的真实特征信息。附图说明图1是本专利技术的实现流程图;图2是ORL数据库中第一个人的10张灰度图片;图3是ORL数据库上5种多视图算法随维度变化的平均识别结果;图4是AR数据库中第一个人的14张灰度图片;图5是AR数据库上5本文档来自技高网
...
一种利用特征信息的加权典型相关分析方法

【技术保护点】
一种利用特征信息的加权典型相关分析方法,包括以下步骤:(1)给定一组大小为N且已经中心化处理后的样本对作为输入数据集:

【技术特征摘要】
1.一种利用特征信息的加权典型相关分析方法,包括以下步骤:(1)给定一组大小为N且已经中心化处理后的样本对作为输入数据集:(2)重新描述数据集X和Y,如下:X=[a1,a2,...,ap]T,Y=[b1,b2,...,bq]T,其中,和分别是X和Y的第i个特征的特征向量;(2.1)计算各个特征对应的特征方差λi=var(ai),i=1,2,...,p,μi=var(bi),i=1,2,...,q;(2.2)利用λi和μi对原始特征数据集X和Y进行加权处理,得到处理后的特征数据集和(3)由和计算协方差矩阵和互协方差矩阵(4)求解如下的目标函数:得到投影向量集d为选取的特征投影向量的个数,表示前d大相关性的特征投影...

【专利技术属性】
技术研发人员:葛洪伟顾高升李莉朱嘉钢
申请(专利权)人:江南大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1