一种基于全局表示和驱动融合的不完备多视图聚类方法技术

技术编号:42980334 阅读:34 留言:0更新日期:2024-10-15 13:16
本发明专利技术公开了一种基于全局表示和驱动融合的不完备多视图聚类方法。该方法首先通过特定视图编码器获得视图的特定表示,并定义一个共享编码网络来学习所有视图的全局表示。在此基础上,利用自定义的预测网络,通过特定表示和全局表示的共同预测,恢复缺失的不完备视图信息。接着,本方法提出了一种具有调节因子的驱动融合方案。该方案为每个恢复后的视图表示定义一个权重向量,通过调节因子自我学习,获得最佳权重分配,从而实现融合。最后,在融合后的统一视图表示上进行聚类,得到最终的聚类结果。本发明专利技术通过利用全局表示充分挖掘视图间的一致性和互补性,并将表示学习和数据恢复统一在一个框架内,从信息理论角度进行整合。利用预测网络进行数据恢复后,提出带有调节因子的融合网络,充分考虑了不同视图之间的数据恢复差异,从而显著提高了模型的性能。

【技术实现步骤摘要】

本专利技术属于计算机,具体涉及一种基于全局表示和驱动融合的不完备多视图聚类方法


技术介绍

1、随着数据量的增长,现实生活中存在大量无标签数据,这些数据大多数可被认为是多视图数据。例如,癌症的致病因子可以通过甲基化、dna和mirna不同视角进行分析。面对多视图数据,传统的单一视角数据挖掘方法难以处理。因此,学者们研究了大量多视图聚类方法,旨在综合利用来自多个视角的信息,更准确地揭示数据的内在结构,为数据挖掘任务提供更全面和深入的解决方案。

2、然而,由于多视图数据在收集、传输过程中存在一些不可控因素,导致数据存在缺失值,出现数据不完备情况。为了更好地服务于数据挖掘任务,不完备多视图聚类引起了广泛关注。在不完备多视图聚类中,关键问题在于对缺失数据的处理。最初的方法采用简单的均值、k近邻算法估算缺失值并进行聚类,但这些方法填充的数据过于简单。随后,研究者利用共识表示、张量分解或神经网络等技术进行填补,但这些方法易受填充数据质量的影响,且增加了算法的计算复杂度。

3、为了避免对缺失数据的插补,大量方法在信息论框架下研究了利用互信息、条件熵本文档来自技高网...

【技术保护点】

1.一种基于全局表示和驱动融合的不完备多视图聚类方法,包括视图的表示学习,特定视图重构,对比学习,协同学习和基于调节因子的驱动融合,其特点在于:包括以下步骤:

2.根据权利要求1所述的基于全局表示和驱动融合的不完备多视图聚类方法,其特征在于,步骤(1)所述的视图的表示学习具体如下:

3.根据权利要求1所述的基于全局表示和驱动融合的不完备多视图聚类方法,其特征在于,步骤(2)所述的特定视图重构具体如下:

4.根据权利要求1所述的基于全局表示和驱动融合的不完备多视图聚类方法,其特征在于,步骤(3)所述的对比学习具体如下:

5.根据权利要求1所述...

【技术特征摘要】

1.一种基于全局表示和驱动融合的不完备多视图聚类方法,包括视图的表示学习,特定视图重构,对比学习,协同学习和基于调节因子的驱动融合,其特点在于:包括以下步骤:

2.根据权利要求1所述的基于全局表示和驱动融合的不完备多视图聚类方法,其特征在于,步骤(1)所述的视图的表示学习具体如下:

3.根据权利要求1所述的基于全局表示和驱动融合的不完备多视图聚类方法,其特征在于,步骤(2)所述的特定视图重...

【专利技术属性】
技术研发人员:刘文哲蒋雳张永刘笪
申请(专利权)人:湖州师范学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1