【技术实现步骤摘要】
一种基于局部线性嵌入的特征一致性多视角聚类算法
[0001]本专利技术涉及基于图的多视角聚类领域,具体为一种基于局部线性嵌入的特征一致性多视角聚类算法。
技术介绍
[0002]聚类技术在数据挖掘、模式识别等领域一直发挥着重要作用。它的主要思想是将所有数据在没有标签的时候分成不同的类簇,使得同一类簇中的数据具有较高的相似性,并且不同类簇的数据具有较低的相似性。随着信息时代的高速发展,各种数据资源高速增长。例如,在图像处理领域,一个图像可以有不同的颜色、形状、纹理等多种不同的视图。在生物信息学中,一个生物样本可以通过不同的技术获得不同的特征。传统的聚类方法是基于单视角数据的,它仅仅考虑了单一视图的数据。但是,随着多视角数据量的增加,传统单视角聚类方法难以满足需求,多视角聚类应运而生。多视角聚类方法通过结合多种不同视图的数据信息,提高了聚类的准确性和鲁棒性。同时,多视角聚类方法也可以更好地发现数据的多样性和内在结构,为数据挖掘、数据分析等任务提供更丰富的信息。
[0003]目前,基于图的多视角聚类方法由于其优秀的聚类性能受到了广泛的关注。它能够更直接地捕捉数据间的相似关系,更好地表示数据的复杂结构。其他类型的多视角聚类方法通常是将多个视角的数据分别进行聚类后再进行整合,而基于图的多视角聚类方法是通过建立图的形式来表示多个视角之间的关系,可以更好地获取样本间的相似性。虽然现在存在很多基于图的方法并且取得了良好的性能,但是目前仍然存在一些问题需要解决。例如,一些基于图的多视角聚类方法只考虑了样本间的关系,但是可能忽略了 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种基于局部线性嵌入的特征一致性多视角聚类算法,其特征在于,包括:步骤S1,归一化数据集X为X
′
,利用最值归一化的方法减少优化过程中受数据数量级影响,加快模型的收敛速度;步骤S2,构建局部线性嵌入的特征一致性多视角聚类模型;步骤S3,初始化投影维度参数d
′
,范围为{50,100,150,200,250,300),参数β以及矩阵B,B
v
,μ=105,迭代次数最大值为500,初始化B,B
v
为0∈R
d
′×
d
;步骤S4,输入X
′
,B,B
v
,对每个视角的优化变量B
v
进行循环迭代优化;步骤S5,获取拉普拉斯矩阵:通过最优的共享映射B获得最佳的样本BX,并对其计算相似度矩阵S,构建其对应的拉普拉斯矩阵L对其做谱聚类得到特征向量F;步骤S6,最终通过K
‑
means的方式聚类特征向量F,得到最终的聚类结果。2.根据权利要求1所述的一种基于局部线性嵌入的特征一致性多视角聚类算法,其特征在于,所述步骤S1中,利用最值归一化将样本点值映射到[0,1]之间,具体方式如下:其中,代表矩阵X第i个向量的最小值和最大值。3.根据权利要求1所述的一种基于局部线性嵌入的特征一致性多视角聚类算法,其特征在于,所述步骤S2中,构建的局部线性嵌入的特征一致性多视角聚类模型为:s.t.B∈{0,1}
d
′×
d
,其中,B
v
代表每个视角对应的映射矩阵,B代表共享映射矩阵,W
v
代表局部重建系数矩阵,X
′
v
代表归一化后的样本。4.根据权利要求1所述的一种基于局部线性嵌入的特征一致性多视角聚类算法,其特征在于,所述步骤S4中,损失函数优化,采用交替子乘法遵循下列迭代顺序:B
(t+1)
=argmin
B
L(B,Q
(t)
);Q
技术研发人员:王丽娟,邢津萍,尹明,郝志峰,蔡瑞初,陈炳丰,温雯,
申请(专利权)人:广东工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。