【技术实现步骤摘要】
自适应图约束典型相关分析的多视图特征融合方法及系统
[0001]本专利技术属于机器学习
,具体涉及一种自适应图约束典型相关分析的多视图特征融合方法及系统。
技术介绍
[0002]多视图数据是指对一个共同的数据源,采用多种数据获取手段得到的多组具有不同特性的数据。这种多视图数据通过数据间属性的互补,能够产生更全面的信息。利用不同视图间的一致性信息和互补性信息,进行多视图学习,能够有效改善许多机器学习算法的性能。因此,多视图学习具有广阔的研究价值。典型相关分析(Canonical Correlation Analysis,CCA)是多视图特征提取的一个经典算法,被广泛应用于多视图降维、聚类等任务,其主要思想是寻找一组投影向量,使得不同视图数据在投影后的相关系数最大化。多视图典型相关分析(Multi
‑
View Canonical Correlation Analysis,MCCA)对CCA进行推广,使其适用于两个以上视图的情况,拓宽了CCA的应用范围。CCA和MCCA在气象分析、生物信息融合等领域得到了广泛应用。
[0003]随着近年来图约束方法在机器学习的多个领域如降维、数据重建、聚类、分类等问题中表现出了优良性能,图约束的多视图典型相关分析(Graph Multi
‑
View Canonical Correlation Analysis,GMCCA)也被提出。GMCCA在寻找多视图数据的一致性特征时,考虑了数据的内在特性,并通过图约束对数据结构关系加以描述,其分类、聚 ...
【技术保护点】
【技术特征摘要】
1.一种自适应图约束典型相关分析的多视图特征融合方法,其特征在于,包括:进行结构化图的学习,求解低维数据源间的相似关系,并通过引入对拉普拉斯矩阵秩的约束,使结构化图中的连通分量个数与数据类别数相同;通过得到的结构化图来约束多视图典型相关分析,得到新的无监督多视图特征学习目标函数,并通过交替优化的方法进行求解,实现多视图特征融合。2.根据权利要求1所述自适应图约束典型相关分析的多视图特征融合方法,其特征在于,所述进行结构化图的学习,求解低维数据源间的相似关系,并通过引入对拉普拉斯矩阵秩的约束,使结构化图中的连通分量个数与数据类别数相同具体包括如下步骤:令G∈R
N
×
N
为图结构对应的相似度矩阵,用G中的元素g
ij
表示两个低维数据源s
i
与s
j
为相邻节点的可能性,若s
i
和s
j
之间的欧氏距离越近,则二者关系越紧密;加入正则项避免平凡解的出现,加入对拉普拉斯矩阵秩的约束rank(L
G
)=N
‑
C,使得到的图结构中恰好包含数据类别数目个连通分量,构造以下优化问题求解G:s.t.rank(L
G
)=N
‑
C,G≥0,式中,L
G
为与相似度矩阵G对应的拉普拉斯矩阵,C为数据类别个数,g
i
为G的行向量。3.根据权利要求2所述自适应图约束典型相关分析的多视图特征融合方法,其特征在于,所述新的无监督多视图特征学习目标函数的表达式如下:s.t.rank(L
G
)=N
‑
C,G≥0,SS
T
=I式中,为需要提取特征的多视图数据,为多视图数据对应的投影矩阵,S∈R
d
×
N
为多视图数据的一致性特征,M≥2,D
m
为第m个视图数据样本的维度,N为数据集样本的个数,d为降维后的数据维度。4.根据权利要求3所述自适应图约束典型相关分析的多视图特征融合方法,其特征在于,令σ
i
(L
G
)为矩阵L
G
中第i个最小的特征值,σ
i
(L
G
)非负,则所述新的无监督多视图特征学习目标函数的表达式等价表示为:s.t.G≥0,SS
T
=I当γ足够大时,最优解使表达式最后一项为0,满足约束条件rank(L
G
)=N
‑
C;又有其中F∈R
N
×
...
【专利技术属性】
技术研发人员:王飞,王一诺,郭宇,张雪涛,孙源,张秋光,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。