【技术实现步骤摘要】
不完备多视图聚类方法、系统、设备以及存储介质
[0001]本专利技术涉及一种不完备多视图聚类方法、系统、设备以及存储介质。
技术介绍
[0002]随着信息技术的飞速发展,多视图学习问题在多媒体检索、高光谱图像分类、多组学数据分析、医疗数据分析等领域得到了广泛的研究。多视图学习的关键是充分利用多个视图之间的互补信息,方便后续的数据处理任务。在过去的几十年里,不完备多视图聚类已经取得了显著的进展,其是基于完备多视图假设,即每个视图均不存在样本的缺失。然而,在实际应用中并非总是如此,收集的多视图数据集可能是不完整的,例如某些视图缺少一些样本。这就导致了不完备多视图聚类(incomplete multiview clustering,IMC)问题。
[0003]基于图的IMC模型通过融合多个不完备视图的图矩阵得到聚类结果。文献[1]提出了不完备多模态分组模型,通过优化共享的完备图拉普拉斯项得到融合表征,在优化过程中同时更新相似度矩阵,该方法只能处理包含两个视图的数据。文献[2]中提出了一个基于低秩表示学习的IMC模型,通过低 ...
【技术保护点】
【技术特征摘要】
1.一种不完备多视图聚类方法,其特征在于,该方法包括如下步骤:a.将原始多视图数据矩阵在所提出的基于逐层范数补偿和超图正则的深度不完备非负矩阵分解框架下分解;b.对分解后的多视图数据矩阵进行聚类。2.如权利要求1所述的不完备多视图聚类方法,其特征在于,所述的方法还包括步骤:c.采用聚类精度AC和归一化互信息NMI度量聚类结果。3.如权利要求2所述的不完备多视图聚类方法,其特征在于,所述的步骤a包括:步骤S101,原始多视图数据矩阵中第m个视图的数据矩阵为步骤S101,原始多视图数据矩阵中第m个视图的数据矩阵为其中:d
m
为第m个视图样本的维数,n
m
为第m个视图样本个数;步骤S102,初始化每个视图各层的基矩阵系数矩阵以及一致对齐矩阵为[0,1)的随机非负矩阵,上述三个矩阵维度分别为:p
l
‑1×
p
l
、p
l
×
n
m
和p
L
×
n;其中,p
l
是各层隐空间维度;n是非缺失情况下样本总个数;步骤S103,根据每个视图缺失样本的位置,定义对应的缺失映射矩阵G
m
:如果在完整数据中的第i个样本是缺失数据中的第j个样本,那么否则步骤S104,构建K近邻的热核相似度矩阵S
m
,近邻个数设置为k,如果节点是节点的k近邻或者j=i,则否则步骤S105,计算顶点
‑
边激活矩阵K
m
,如果节点属于边则否则其中,所述边以每个所述节点本身为中心构建;步骤S106,计算对角超边权重W
m
,步骤S107,计算对角顶点度矩阵步骤S107,计算对角顶点度矩阵步骤S108,计算超边度矩阵步骤S108,计算超边度矩阵步骤S109,计算每个视图的超图拉普拉斯矩阵步骤S109,计算每个视图的超图拉普拉斯矩阵是顶点的度矩阵,步骤S110,构建各视图的超图正则项:以利用各视图数据的高阶分布结构信息;步骤S111,构建不完备多视图对齐约束项:最终得到如下最小化问题:
其...
【专利技术属性】
技术研发人员:崔国盛,李烨,吴丹,
申请(专利权)人:中国科学院深圳先进技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。