【技术实现步骤摘要】
一种基于核范数约束的多视图聚类方法及系统
[0001]本专利技术涉及计算机视觉
,更具体地,涉及一种基于核范数约束的多视图聚类方法及系统。
技术介绍
[0002]谱聚类是一种广泛使用的聚类算法,比起传统的K
‑
Means算法,谱聚类对数据分布的适应性更强,聚类效果也很优秀,同时聚类的计算量也小很多,更加难能可贵的是实现起来也不复杂。谱聚类是从图论中演化出来的算法,后来在聚类中得到了广泛的应用。它的主要思想是把所有的数据看做空间中的点,这些点之间可以用边连接起来。距离较远的两个点之间的边权重值较低,而距离较近的两个点之间的边权重值较高,通过对所有数据点组成的图进行切图,让切图后不同的子图间边权重和尽可能的低,而子图内的边权重和尽可能的高,从而达到聚类的目的。谱聚类算法中,相比单视图子空间聚类算法,多视图子空间聚类算法融合了多个视图的信息,充分考虑了不同视图的多样性,达到比单个视图更有效的聚类效果。
[0003]目前多视图聚类的相关的算法研究大致可以分为三类:基于协同训练的算法、基于多核学习的算法和子空间学习算法。基于协同训练的算法隐含地利用了聚类假设或流形假设,能够利用先验信息或相互学习知识,使两种不同视图的一致性最大化。该方法有一定的假设条件,并且要求数据具有两个充分冗余且满足条件独立性的视图。多核学习能够提高内核函数的搜索空间容量,从而具有良好的泛化性。多视图子空间聚类一般可以通过两种方式获得统一的特征表示:直接从多个子空间中获取单一表示;在学习一个潜在空间后获取统一表示。但是大多数 ...
【技术保护点】
【技术特征摘要】
1.一种基于核范数约束的多视图聚类方法,其特征在于,包括以下步骤:S1:对输入的多视图数据进行预处理;S2:计算多视图数据样本之间的相似度,得到权重矩阵;S3:将多视图数据中来自同一单视图的数据进行映射得到子空间,再对子空间采用核范数约束;S4:将单视图投影到一个公共的受秩约束的低维子空间,得到目标函数;S5:将目标函数从有约束问题转换为无约束问题,并对目标函数中的变量交替迭代优化至收敛,在优化后的低维子空间上运用谱聚类方法对多视图数据进行聚类,得到聚类结果。2.根据权利要求1所述的多视图聚类方法,其特征在于,对输入的多视图原始数据进行预处理的步骤包括:S11:特征提取:对同一批多视图数据采用多种特征提取方法得到不同的特征;S12:数据清洗:对多视图数据中缺失部分采用样条插值法进行插值;对多视图数据中极大或极小的异常值采用取平均值法进行替换。3.根据权利要求1所述的多视图聚类方法,其特征在于,所述S2步骤中,采用相似度度量函数计算多视图数据样本之间的相似度得到权重矩阵W
v
,其表达公式如下:式中,权重矩阵为由相似度组成的矩阵;表示第v个视图中第i个样本与第j个样本之间的相似度,表示第v个视图中第i个样本,表示第v个视图中第j个样本,表示与第v个视图中第i个样本最邻近的样本;k表示聚类簇数。4.根据权利要求3所述的多视图聚类方法,其特征在于,所述S2步骤中,还包括以下步骤:根据所述权重矩阵对多视图数据执行流形正则化,其表达公式如下:L
v
=D
v
‑
W
v
式中,Tr(
·
)表示矩阵的迹,Z
v
表示第v个视图的投影空间,L
v
表示第v个视图的拉普拉斯矩阵,D
v
为第v个视图的权重矩阵W
v
对应的对角矩阵。5.根据权利要求3所述的多视图聚类方法,其特征在于,所述S3步骤中,对子空间采用核范数约束,其中核范数约束的表达式如下:s.t.X=XZ式中,Z为多视图数据的投影空间,X为多视图数据的矩阵;||
·
||
*
表示核范数。6.根据权利要求5所述的多视图聚类方法,其特征在于,所述S4步骤中,所述公共的低
维子空间受拉普拉斯秩约束。7.根据权利要求6所述的多视图聚类方法,其特征在于,将单视图投影到一个公共的受拉普拉斯秩约束的低维子空间得到的目标函数表达公式如下:diag(Z
v
)=01
T
a
i
=1,0≤a
i
≤1,i=1,2,...,nrank(L
A
)=n
‑
cL
A
=D
A
‑
W
A
式中,Tr(
·
)表示矩阵的迹,Z
v
表示第v个视图的投影空间,L
v
表示第v个视图的拉普拉斯矩阵;m为视图数,n为样本数;diag(
·
)表示矩阵的对角元素,rank(
·
)表示矩阵的秩;a
i
表示低维的公共子空间A中的第i列元素;表示L2范数;α、β、γ为对应的正则化参数;P是求解过程中引进的中间变量,P的大小为n行c列;L
A
表示关于低维的公共子空间A的拉普拉斯矩阵,W
A
为低维的公共子空间A的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。