基于拓扑张量的不完备多视图无监督聚类分析方法及系统技术方案

技术编号:40396847 阅读:22 留言:0更新日期:2024-02-20 22:24
本申请公开了一种基于拓扑张量的不完备多视图无监督聚类分析方法及系统,方法应用于不完备多视图数据聚类,包括基于特征提取模型提取各不完备视图数据的视图特征确定共有视图特征和各相似度图,基于共有视图特征确定共有相似度图;基于各视图特征、相似度图及共有相似度图学习各不完备视图数据的相似性矩阵,最后根据学习到的各相似性矩阵确定聚类结果。本申请充分考虑了各不完备视图数据的拓扑关系,为样本间的相似度提供更准确的度量。同时,通过对相似度矩阵进行迭代来弥补因样本缺少而导致的相似度缺失问题,并考虑已观测样本间的相似度保持、未观测样本相似度推理及聚簇结构保持,获取到更为精确且灵活的相似度,提高了聚类结果的准确性。

【技术实现步骤摘要】

本申请涉及多媒体,特别涉及一种基于拓扑张量的不完备多视图无监督聚类分析方法及系统


技术介绍

1、随着多媒体技术的发展,多媒体数据的数量急剧增长。多媒体数据往往收集自不同的领域,或者被利用不同的特征进行表示,从而形成了多视图数据。在众多多视图数据分析方法中,多视图聚类受到了广泛的关注。相比于单视图聚类,多视图聚类同时利用不同种类的特征进行训练,从而提升了聚类精度,拥有广泛的应用场景。然而,目前主流的多视图聚类方法是基于视图具有完备性这一假设进行的,即每个样本在每个视图中均被观测到,并可以被应用于模型训练。但是,在实际场景的应用中,由于在数据采集过程中可能出现样本缺失或模态缺失等问题,从而引出了不完备多视图聚类问题(incomplete multi-viewclustering,imc)。

2、imc问题旨在对于任意样本缺失情况下的多视图数据进行无监督的类别划分,并通过融合各个视图的数据提升聚类精度。如何探索不完备的多个视图之间的一致性信息和互补信息成为亟待解决的问题。与此同时,由于每个视图只有部分样本被观测到,如何充分地利用视图之间的相似性和联本文档来自技高网...

【技术保护点】

1.一种基于拓扑张量的不完备多视图无监督聚类分析方法,其特征在于,所述的基于拓扑张量的不完备多视图无监督聚类分析方法具体包括:

2.根据权利要求1所述的基于拓扑张量的不完备多视图无监督聚类分析方法,其特征在于,所述各不完备视图数据上的相似度图和所述共有相似度图均为基于欧氏距离确定的,用于反映样本内在的欧氏空间信息。

3.根据权利要求1所述的基于拓扑张量的不完备多视图无监督聚类分析方法,其特征在于,所述基于各不完备视图数据、各不完备视图数据的相似度图以及所述共有相似度图学习各不完备视图数据的相似性矩阵,以得到各不完备视图数据的目标相似性矩阵具体包括:

4...

【技术特征摘要】

1.一种基于拓扑张量的不完备多视图无监督聚类分析方法,其特征在于,所述的基于拓扑张量的不完备多视图无监督聚类分析方法具体包括:

2.根据权利要求1所述的基于拓扑张量的不完备多视图无监督聚类分析方法,其特征在于,所述各不完备视图数据上的相似度图和所述共有相似度图均为基于欧氏距离确定的,用于反映样本内在的欧氏空间信息。

3.根据权利要求1所述的基于拓扑张量的不完备多视图无监督聚类分析方法,其特征在于,所述基于各不完备视图数据、各不完备视图数据的相似度图以及所述共有相似度图学习各不完备视图数据的相似性矩阵,以得到各不完备视图数据的目标相似性矩阵具体包括:

4.根据权利要求3所述的基于拓扑张量的不完备多视图无监督聚类分析方法,其特征在于,所述基于各不完备视图数据的待学习相似性矩阵和各相似度图的误差来构建第二学习项具体包括:

5.根据权利要求3所述的基于拓扑张量的...

【专利技术属性】
技术研发人员:张正何汶珏
申请(专利权)人:哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1