一种基于局部线性嵌入的特征一致性多视角聚类算法制造技术

技术编号:37393121 阅读:17 留言:0更新日期:2023-04-27 07:30
本发明专利技术公开了一种基于局部线性嵌入的特征一致性多视角聚类算法,包括:步骤S1,归一化数据集X为X

【技术实现步骤摘要】
一种基于局部线性嵌入的特征一致性多视角聚类算法


[0001]本专利技术涉及基于图的多视角聚类领域,具体为一种基于局部线性嵌入的特征一致性多视角聚类算法。

技术介绍

[0002]聚类技术在数据挖掘、模式识别等领域一直发挥着重要作用。它的主要思想是将所有数据在没有标签的时候分成不同的类簇,使得同一类簇中的数据具有较高的相似性,并且不同类簇的数据具有较低的相似性。随着信息时代的高速发展,各种数据资源高速增长。例如,在图像处理领域,一个图像可以有不同的颜色、形状、纹理等多种不同的视图。在生物信息学中,一个生物样本可以通过不同的技术获得不同的特征。传统的聚类方法是基于单视角数据的,它仅仅考虑了单一视图的数据。但是,随着多视角数据量的增加,传统单视角聚类方法难以满足需求,多视角聚类应运而生。多视角聚类方法通过结合多种不同视图的数据信息,提高了聚类的准确性和鲁棒性。同时,多视角聚类方法也可以更好地发现数据的多样性和内在结构,为数据挖掘、数据分析等任务提供更丰富的信息。
[0003]目前,基于图的多视角聚类方法由于其优秀的聚类性能受到了广泛的关注。它能够更直接地捕捉数据间的相似关系,更好地表示数据的复杂结构。其他类型的多视角聚类方法通常是将多个视角的数据分别进行聚类后再进行整合,而基于图的多视角聚类方法是通过建立图的形式来表示多个视角之间的关系,可以更好地获取样本间的相似性。虽然现在存在很多基于图的方法并且取得了良好的性能,但是目前仍然存在一些问题需要解决。例如,一些基于图的多视角聚类方法只考虑了样本间的关系,但是可能忽略了样本的特征,样本的特征可以优化聚类的结果。通常,每个视图的数据差别很大,其特征也存在较大的差异,一些基于图的多视角聚类方法忽略了不同视角下数据的特征差异,影响聚类的效果。一些基于图的多视角聚类方法直接在原始空间中进行相似度矩阵的构建,不能充分地利用判别性信息。
[0004]为此,结合以上需求,本专利技术提出了一种基于局部线性嵌入的特征一致性多视角聚类算法。

技术实现思路

[0005]本专利技术的目的在于克服现有的缺陷而提供的一种基于局部线性嵌入的特征一致性多视角聚类算法,通过学习不同样本视角间的判别性特征以及挖掘样本间的一致性特征,从而提升聚类的性能。
[0006]实现上述目的的技术方案是:
[0007]一种基于局部线性嵌入的特征一致性多视角聚类算法,包括:
[0008]步骤S1,归一化数据集X为X

,利用最值归一化的方法减少优化过程中受数据数量级影响,加快模型的收敛速度;
[0009]步骤S2,构建局部线性嵌入的特征一致性多视角聚类模型;
[0010]步骤S3,初始化投影维度参数d

,范围为{50,100,150,200,250,300},参数β以及矩阵B,B
v
,μ=105,迭代次数最大值为500,初始化B,B
v
为0∈R
d
′×
d

[0011]步骤S4,输入X

,B,B
v
,对每个视角的优化变量B
v
进行循环迭代优化;
[0012]步骤S5,获取拉普拉斯矩阵:通过最优的共享映射B获得最佳的样本BX,并对其计算相似度矩阵S,构建其对应的拉普拉斯矩阵L对其做谱聚类得到特征向量F;
[0013]步骤S6,最终通过K

means(硬聚类)的方式聚类特征向量F,得到最终的聚类结果。
[0014]优选的,所述步骤S1中,利用最值归一化将样本点值映射到[0,1]之间,具体方式如下:
[0015][0016]其中,代表矩阵X第i个向量的最小值和最大值。
[0017]优选的,所述步骤S2中,构建的局部线性嵌入的特征一致性多视角聚类模型为:
[0018][0019][0020]其中,B
v
代表每个视角对应的映射矩阵,B代表共享映射矩阵,W
v
代表局部重建系数矩阵,X

v
代表归一化后的样本。
[0021]优选的,所述步骤S4中,损失函数优化,采用交替子乘法遵循下列迭代顺序:
[0022][0023][0024]Σ
(t+1)
=Σ
(t)
+λ(Q
(t+1)

P
v
B
v(k+1)

[0025]B
(t+1)
=argmin
B
L(B
(t)
);
[0026]其中t代表迭代次数下标,并在每次迭代中加1。
[0027]优选的,通过交替方向乘子法对B
v
,B进行求解,B
v
,B计算方法如下:
[0028]由于矩阵的向量之间相互独立,可依次对每个视角求解:
[0029]固定变量B,Q,求解B
v
:
[0030][0031]对上式求导并设为0,对上式求导并设为0,
[0032]由KKT(全称:Karush

Kuhn

Tucher,非线性规划最佳解的必要条件)条件可知:Φ
ij
B
ij
=0。
[0033]由任意矩阵F=F
+

F

,设
[0034][0035][0036]固定变量B
v
,B,求解Q
v
:
[0037][0038]固定变量B
v
,Q,求解B:
[0039][0040]迭代更新各个矩阵,最后计算目标损失函数的值,如果在规定阈值内,或是达到设置的最大迭代次数时结束迭代,获得最后的B矩阵。
[0041]优选的,所述步骤S5中,B矩阵进行样本映射,通过BX

得到映射后的样本,然后对其计算样本之间的距离计算相似度,并对相似度矩阵施加Frobenius范数,具体学习相似度矩阵公式如下:
[0042][0043]计算得到的拉普拉斯矩阵
[0044]优选的,所述步骤S6中,对拉普拉斯矩阵L做谱聚类,min
F
tr(F
T
LF);得到特征向量F后,最终对特征向量F做K

means聚类得到最终的聚类结果。
[0045]本专利技术的有益效果是:
[0046]本专利技术构建了一个从人脸图像等非线性数据中获取多个视角间的内在一致性特征的聚类模型;以局部线性嵌入算法为基础,拟合非线性的流形结构数据信息,并在此之上选择不同视角的判别性特征,提出一个共享特征筛选器,获取不同视角间潜在的一致性特征,从而提高聚类准确率。本专利技术基于视角间的一致性特征信息,挖掘不同视角间的潜在一致性,避免了不同视角间的差异信息以及噪音等干扰因素导致的聚类准确率本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于局部线性嵌入的特征一致性多视角聚类算法,其特征在于,包括:步骤S1,归一化数据集X为X

,利用最值归一化的方法减少优化过程中受数据数量级影响,加快模型的收敛速度;步骤S2,构建局部线性嵌入的特征一致性多视角聚类模型;步骤S3,初始化投影维度参数d

,范围为{50,100,150,200,250,300),参数β以及矩阵B,B
v
,μ=105,迭代次数最大值为500,初始化B,B
v
为0∈R
d
′×
d
;步骤S4,输入X

,B,B
v
,对每个视角的优化变量B
v
进行循环迭代优化;步骤S5,获取拉普拉斯矩阵:通过最优的共享映射B获得最佳的样本BX,并对其计算相似度矩阵S,构建其对应的拉普拉斯矩阵L对其做谱聚类得到特征向量F;步骤S6,最终通过K

means的方式聚类特征向量F,得到最终的聚类结果。2.根据权利要求1所述的一种基于局部线性嵌入的特征一致性多视角聚类算法,其特征在于,所述步骤S1中,利用最值归一化将样本点值映射到[0,1]之间,具体方式如下:其中,代表矩阵X第i个向量的最小值和最大值。3.根据权利要求1所述的一种基于局部线性嵌入的特征一致性多视角聚类算法,其特征在于,所述步骤S2中,构建的局部线性嵌入的特征一致性多视角聚类模型为:s.t.B∈{0,1}
d
′×
d
,其中,B
v
代表每个视角对应的映射矩阵,B代表共享映射矩阵,W
v
代表局部重建系数矩阵,X

v
代表归一化后的样本。4.根据权利要求1所述的一种基于局部线性嵌入的特征一致性多视角聚类算法,其特征在于,所述步骤S4中,损失函数优化,采用交替子乘法遵循下列迭代顺序:B
(t+1)
=argmin
B
L(B,Q
(t)
);Q

【专利技术属性】
技术研发人员:王丽娟邢津萍尹明郝志峰蔡瑞初陈炳丰温雯
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1