一种多视图特征判别方法技术

技术编号:18497999 阅读:37 留言:0更新日期:2018-07-21 20:36
本发明专利技术公开了一种多视图特征判别方法,属于数据挖掘领域。该方法针对分类预测任务,构建视图的典型相关分析优化目标并对优化目标进行求解,从视图组合特征和类别相关性两方面优化目标,得到更具有判别性的属性特征。该方法的实施思路分为两个过程:首先构建优化目标,计算相关参数:类内和类间相关矩阵、视图组合特征的类内和类间散布矩阵、视图的协方差矩阵等;然后求解优化目标,得到新的空间投影矩阵,利用目标投影矩阵将原始多视图特征映射到新的特征空间,得到更具判别性的多视图特征,最后信息融合得到一个视图。本发明专利技术可用于疾病诊断、文本分类、人脸识别、语音识别等诸多分类问题的特征判别分析以及降维,能显著提升分类准确率。

A multi view feature discrimination method

The invention discloses a multi view feature distinguishing method, which belongs to the field of data mining. This method aims at the classification prediction task, constructs the canonical correlation analysis optimization target of view and solves the optimization target, and optimizes the target from the two aspects of the view combination feature and the category correlation, and obtains the more discriminative attribute characteristics. The idea of implementation of this method is divided into two processes: first, the optimization target is constructed and the related parameters are calculated: intra class and interclass correlation matrix, intra class and interclass scatter matrix and covariance matrix of view, and then the optimization target is solved, a new space projection matrix is obtained, and the original projection matrix will be used as the original matrix. Multi view features are mapped to the new feature space to get more discriminative multi view features. Finally, a view is obtained by information fusion. The invention can be used for feature discrimination analysis and dimensionality reduction of many classification problems, such as disease diagnosis, text classification, face recognition, speech recognition, and so on, which can significantly improve the classification accuracy.

【技术实现步骤摘要】
一种多视图特征判别方法
本专利技术属于数据挖掘

技术介绍
随着信息技术的快速发展,基于大数据的科学研究和生产实践已经普遍化,面对海量数据,获取隐藏在他们背后的关键特征信息具有重要的意义。传统的对单一视图的数据分析已经不能满足当前科学进步发展要求。基于多视图的学习可以得到海量数据内在的联系以及隐藏在这些数据背后的有价值信息,同时可以解决“维数灾难”问题。其中,判别型的典型相关分析方法作为二元视图特征学习以及降维的主要方法,在疾病诊断、文本分类、人脸识别、语音识别、网页分类等研究领域得到了广泛的应用。然而,已有的判别典型相关分析方法并没有专门针对分类预测任务优化目标。大部分方法的优化目标考虑的因素比较单一,有些算法只考虑了视图类内和类间的相关性大小,忽略了用于分类任务的组合特征判别性能,有些方法只在视图相关性的基础上考虑了视图特征的判别性,忽略了类别之间的相关性,不能很好地应用于分类任务。因此,专门针对分类预测任务,综合考虑特征的判别性和类别之间的相关性,提出一种多视图特征判别方法,获得更具有判别性和相关性的判别性特征,提高后续分类预测任务的准确率。通过对现有的专利及相关技术的本文档来自技高网...

【技术保护点】
1.一种多视图特征判别方法,包括以下步骤:步骤一、构建视图的典型相关分析优化目标并对优化目标进行求解,具体实现步骤如下:(1)获得二元视图数据,记样本集X=[x1,x2,...,xn]∈R

【技术特征摘要】
1.一种多视图特征判别方法,包括以下步骤:步骤一、构建视图的典型相关分析优化目标并对优化目标进行求解,具体实现步骤如下:(1)获得二元视图数据,记样本集X=[x1,x2,...,xn]∈Rp×n,样本集Y=[y1,y2,...,yn]∈Rq×n,设样本集X的均值样本集Y的均值即视图X、Y均已数据中心化;其中,n为视图X、Y的样本个数,p、q分别为视图X、Y的属性个数,xi和yi分别表示视图X、Y的第i个样本;(2)构建优化目标,该优化目标针对分类预测任务,在优化视图类别相关性的同时考虑了视图组合特征的判别分析能力,在充分考虑视图属性类别相关性和判别性的目标下获得两个视图的特征投影矩阵wx和wy;视图组合特征的判别性可用判别准则项来优化,判别准则项可以利用边界费舍尔分析或者线性判别分析项,此时,优化目标函数刻画为:其中,η为控制常量;Cw、Cb分别为类内相关矩阵和类间相关矩阵;f(w,Sb,Sw)为判别准则函数,是目标函数的约束条件,s.t.是“subjectto”的缩写,意思是“受限于”,W表示两个视图投影矩阵的组合数据集,投影矩阵的组合方式采用并行组合或者串行组合;Sb、Sw分别是组合特征的类间散布矩阵和类内散布矩阵,Cxx、Cyy分别为样本集X、Y的自协方差矩阵,上标T表示矩阵的转置;(3)针对...

【专利技术属性】
技术研发人员:杨燕张芳娟杜圣东张熠玲
申请(专利权)人:西南交通大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1