一种针对聚类信息不平衡和信息缺失问题的无监督多视图聚类方法技术

技术编号:43477232 阅读:14 留言:0更新日期:2024-11-29 16:51
一种针对聚类信息不平衡和信息缺失问题的无监督多视图聚类方法,用于多视图数据在视图缺失的情况下,所导致的不完全多视图聚类过程中互补信息总是被忽略和一致性学习不足的情况。该方法首先提出了一种新型的双结构网络,通过延迟激活机制实现多视图数据中的互补性和一致性的有效平衡。对于一致性学习不足的问题,该方法通过最小化条件熵和最大不同视图间的互信息,恢复不完整信息,从而实现多视图一致性学习的增强。延迟激活机制允许网络在聚类过程中逐步引入各个视图的互补信息,从而避免信息丢失。本发明专利技术将平衡问题和一致性学习问题融合在一个统一的框架中,能更好的利用多视图数据的内在关联,显著提升聚类表现。

【技术实现步骤摘要】

本专利技术属于人工智能和多视图数据聚类分析,特别涉及一种针对聚类信息不平衡和信息缺失问题的无监督多视图聚类方法


技术介绍

1、随着信息技术的发展和数据采集手段的多样化,越来越多的应用场景中产生了多视图数据。这些数据来自于不同的来源或视角,包含了丰富且互补的信息。例如,在社交网络分析中,同一个用户的行为数据可以通过不同的社交平台、活动记录等多个视角获取;在医学影像分析中,患者的不同影像类型(如x射线、ct、mri)也提供了多视图数据。这些多视图数据为数据挖掘和分析提供了更全面的信息基础。然而,现有的多视图聚类方法在处理不完全多视图数据时面临着挑战。具体来说,不完全多视图数据中存在视图缺失、数据不完整的情况,使得不同视图间的互补信息难以充分利用,影响了聚类效果。传统的多视图聚类方法通常侧重于视图间的一致性,但往往忽略了不同视图间的互补性信息。由于视图的不完整性和互补信息的忽略,现有方法在处理不完全多视图数据时效果不理想。

2、为了解决上述问题,多视图聚类算法引起了广泛的关注,但由于以下不足,其性能受到限制:1)大部分的多视图聚类方法仅单独关注多视图本文档来自技高网...

【技术保护点】

1.一种针对聚类信息不平衡和信息缺失问题的无监督多视图聚类方法,其特征在于,包括如下步骤:

2.根据权利要求1所述针对聚类信息不平衡和信息缺失问题的无监督多视图聚类方法,其特征在于,所述步骤1中,样本的多视图数据表示为同一个样本的不同角度视图或同一角度的不同模态视图。

3.根据权利要求1所述针对聚类信息不平衡和信息缺失问题的无监督多视图聚类方法,其特征在于,所述在线网络由一个编码器Eθ、一个投影器Pθ和一个预测器Qθ构成;所述目标网络由一个编码器Eδ和一个投影器Pδ构成;每组所述双网络结构中,各编码器用于将视图投影为潜在表示,各投影器用于将潜在表示投影为特定维度,...

【技术特征摘要】

1.一种针对聚类信息不平衡和信息缺失问题的无监督多视图聚类方法,其特征在于,包括如下步骤:

2.根据权利要求1所述针对聚类信息不平衡和信息缺失问题的无监督多视图聚类方法,其特征在于,所述步骤1中,样本的多视图数据表示为同一个样本的不同角度视图或同一角度的不同模态视图。

3.根据权利要求1所述针对聚类信息不平衡和信息缺失问题的无监督多视图聚类方法,其特征在于,所述在线网络由一个编码器eθ、一个投影器pθ和一个预测器qθ构成;所述目标网络由一个编码器eδ和一个投影器pδ构成;每组所述双网络结构中,各编码器用于将视图投影为潜在表示,各投影器用于将潜在表示投影为特定维度,预测器qθ用于将通过编码器和投影器的特征进行线性变换,维度与投影器一致。

4.根据权利要求1所述针对聚类信息不平衡和信息缺失问题的无监督多视图聚类方法,其特征在于,所述在线网络和目标网络通过对比学习进行参数优化,以实现互补性信息和一致性信息的动态平衡;m组双网络结构中的目标网络将样本的m种视图分别投影成m个潜在表示,并通过最小化条件熵恢复样本中缺失视图的潜在表示,同时通过最大化视图间互信息实现一致性学习的增强。

5.根据权利要求4所述针对聚类信息不平衡和信息缺失问题的无监督多视图聚类方法,其特征在于,每组所述双网络结构中,在线网络和目标网络的输出结果进行对比学习,以实现互补性学习;所述在线网络的参数更新方式为梯度下降,所述...

【专利技术属性】
技术研发人员:云静李博许志伟
申请(专利权)人:内蒙古工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1