自适应图约束典型相关分析的多视图特征融合方法及系统技术方案

技术编号:35874526 阅读:15 留言:0更新日期:2022-12-07 11:11
一种自适应图约束典型相关分析的多视图特征融合方法及系统,包括进行结构化图的学习,求解低维数据源间的相似关系,并通过引入对拉普拉斯矩阵秩的约束,使结构化图中的连通分量个数与数据类别数相同;通过得到的结构化图来约束多视图典型相关分析,得到新的无监督多视图特征学习目标函数,并通过交替优化的方法进行求解,实现多视图特征融合。本发明专利技术直接对低维一致性特征构图,避免了对每个视图数据构图并融合的步骤,在参数更少、更容易使用的同时也能保持良好的降维效果;通过引入对拉普拉斯矩阵秩的约束,可直接学习得到一个能反应数据间整体相似关系的图结构,图中连通分量数和数据类别数相等,可提升后续聚类或分类任务的性能。的性能。的性能。

【技术实现步骤摘要】
自适应图约束典型相关分析的多视图特征融合方法及系统


[0001]本专利技术属于机器学习
,具体涉及一种自适应图约束典型相关分析的多视图特征融合方法及系统。

技术介绍

[0002]多视图数据是指对一个共同的数据源,采用多种数据获取手段得到的多组具有不同特性的数据。这种多视图数据通过数据间属性的互补,能够产生更全面的信息。利用不同视图间的一致性信息和互补性信息,进行多视图学习,能够有效改善许多机器学习算法的性能。因此,多视图学习具有广阔的研究价值。典型相关分析(Canonical Correlation Analysis,CCA)是多视图特征提取的一个经典算法,被广泛应用于多视图降维、聚类等任务,其主要思想是寻找一组投影向量,使得不同视图数据在投影后的相关系数最大化。多视图典型相关分析(Multi

View Canonical Correlation Analysis,MCCA)对CCA进行推广,使其适用于两个以上视图的情况,拓宽了CCA的应用范围。CCA和MCCA在气象分析、生物信息融合等领域得到了广泛应用。
[0003]随着近年来图约束方法在机器学习的多个领域如降维、数据重建、聚类、分类等问题中表现出了优良性能,图约束的多视图典型相关分析(Graph Multi

View Canonical Correlation Analysis,GMCCA)也被提出。GMCCA在寻找多视图数据的一致性特征时,考虑了数据的内在特性,并通过图约束对数据结构关系加以描述,其分类、聚类性能相比MCCA取得了明显改善。
[0004]现有的GMCCA算法存在两大不足,导致其性能仍有很大提升空间。其一,采用预定义的图结构对每个视图进行构图,对先验信息的要求较高,因此算法效果严重依赖于所使用图结构的优劣;其二,在构造图约束项时,选取某一视图数据进行构图或用某几个视图数据构图后简单相加,这会导致最终使用的图约束项丢失未使用的视图的信息,或由于对每个视图采用相等的权重致使最终结果不能达到最优。

技术实现思路

[0005]本专利技术的目的在于针对上述现有的图约束算法采用预定义的图结构导致算法对预定义图质量的依赖性较强和不能充分利用每个视图信息以更优地进行各视图的图结构的融合的问题,提供一种自适应图约束典型相关分析的多视图特征融合方法及系统,直接对低维一致性特征构图,避免了对每个视图数据构图并融合的步骤,并通过引入对拉普拉斯矩阵秩的约束,使图中连通分量数和数据类别数相等,从而提升后续聚类或分类任务的性能。
[0006]为了实现上述目的,本专利技术有如下的技术方案:
[0007]一种自适应图约束典型相关分析的多视图特征融合方法,包括:
[0008]进行结构化图的学习,求解低维数据源间的相似关系,并通过引入对拉普拉斯矩阵秩的约束,使结构化图中的连通分量个数与数据类别数相同;
[0009]通过得到的结构化图来约束多视图典型相关分析,得到新的无监督多视图特征学习目标函数,并通过交替优化的方法进行求解,实现多视图特征融合。
[0010]作为优选,所述进行结构化图的学习,求解低维数据源间的相似关系,并通过引入对拉普拉斯矩阵秩的约束,使结构化图中的连通分量个数与数据类别数相同具体包括如下步骤:
[0011]令G∈R
N
×
N
为图结构对应的相似度矩阵,用G中的元素g
ij
表示两个低维数据源s
i
与s
j
为相邻节点的可能性,若s
i
和s
j
之间的欧氏距离越近,则二者关系越紧密;
[0012]加入正则项避免平凡解的出现,加入对拉普拉斯矩阵秩的约束rank(L
G
)=N

C,使得到的图结构中恰好包含数据类别数目个连通分量,构造以下优化问题求解G:
[0013][0014][0015]式中,L
G
为与相似度矩阵G对应的拉普拉斯矩阵,C为数据类别个数,g
i
为G的行向量。
[0016]作为优选,所述新的无监督多视图特征学习目标函数的表达式如下:
[0017][0018][0019]式中,为需要提取特征的多视图数据,为多视图数据对应的投影矩阵,S∈R
d
×
N
为多视图数据的一致性特征,M≥2,D
m
为第m个视图数据样本的维度,N为数据集样本的个数,d为降维后的数据维度。
[0020]作为优选,令σ
i
(L
G
)为矩阵L
G
中第i个最小的特征值,σ
i
(L
G
)非负,则所述新的无监督多视图特征学习目标函数的表达式等价表示为:
[0021][0022][0023]当γ足够大时,最优解使表达式最后一项为0,满足约束条件rank(L
G
)=N

C;
[0024]又有其中F∈R
N
×
C
为辅助变量,则所述新的无监督多视图特征学习目标函数的表达式又表示为:
[0025][0026][0027]作为优选,所述通过交替优化的方法进行求解时,在优化过程中每次都只把一个变量看作未知,而其余变量看作已知,用拉格朗日乘数法进行求解,如此交替进行优化,直至目标函数收敛。
[0028]作为优选,固定无监督多视图特征学习目标函数的表达式中的变量G,F,求解U
m
和S:
[0029]此时,将原优化问题转化为:
[0030][0031]s.t.SS
T
=I
[0032]对U
m
求偏导并置为0,得到:
[0033][0034]引入中间变量,得到:
[0035][0036]对C进行特征分解,则S由C最大的ρ个特征值对应的特征向量构造而成;将求得的S代回U
m
的表达式,则求得对应的U
m

[0037]作为优选,固定无监督多视图特征学习目标函数的表达式中的变量G,U
m
和S,求解F:
[0038]此时,原优化问题转化为:
[0039]min
F
Tr(F
T
L
G
F)
[0040]s.t.F
T
F=I
[0041]通过拉格朗日乘数法,将这一问题转化为特征分解问题,F由L
G
的C个最小的特征值对应的特征向量构成。
[0042]作为优选,固定无监督多视图特征学习目标函数的表达式中的变量F,U
m
和S,求解G:
[0043]此时,原优化问题转化为:
[0044][0045][0046]展开上式,根据KKT条件求得最优解为:
[0047][004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自适应图约束典型相关分析的多视图特征融合方法,其特征在于,包括:进行结构化图的学习,求解低维数据源间的相似关系,并通过引入对拉普拉斯矩阵秩的约束,使结构化图中的连通分量个数与数据类别数相同;通过得到的结构化图来约束多视图典型相关分析,得到新的无监督多视图特征学习目标函数,并通过交替优化的方法进行求解,实现多视图特征融合。2.根据权利要求1所述自适应图约束典型相关分析的多视图特征融合方法,其特征在于,所述进行结构化图的学习,求解低维数据源间的相似关系,并通过引入对拉普拉斯矩阵秩的约束,使结构化图中的连通分量个数与数据类别数相同具体包括如下步骤:令G∈R
N
×
N
为图结构对应的相似度矩阵,用G中的元素g
ij
表示两个低维数据源s
i
与s
j
为相邻节点的可能性,若s
i
和s
j
之间的欧氏距离越近,则二者关系越紧密;加入正则项避免平凡解的出现,加入对拉普拉斯矩阵秩的约束rank(L
G
)=N

C,使得到的图结构中恰好包含数据类别数目个连通分量,构造以下优化问题求解G:s.t.rank(L
G
)=N

C,G≥0,式中,L
G
为与相似度矩阵G对应的拉普拉斯矩阵,C为数据类别个数,g
i
为G的行向量。3.根据权利要求2所述自适应图约束典型相关分析的多视图特征融合方法,其特征在于,所述新的无监督多视图特征学习目标函数的表达式如下:s.t.rank(L
G
)=N

C,G≥0,SS
T
=I式中,为需要提取特征的多视图数据,为多视图数据对应的投影矩阵,S∈R
d
×
N
为多视图数据的一致性特征,M≥2,D
m
为第m个视图数据样本的维度,N为数据集样本的个数,d为降维后的数据维度。4.根据权利要求3所述自适应图约束典型相关分析的多视图特征融合方法,其特征在于,令σ
i
(L
G
)为矩阵L
G
中第i个最小的特征值,σ
i
(L
G
)非负,则所述新的无监督多视图特征学习目标函数的表达式等价表示为:s.t.G≥0,SS
T
=I当γ足够大时,最优解使表达式最后一项为0,满足约束条件rank(L
G
)=N

C;又有其中F∈R
N
×
...

【专利技术属性】
技术研发人员:王飞王一诺郭宇张雪涛孙源张秋光
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1