基于共有差异学习的深度多视图聚类方法、系统及设备技术方案

技术编号:34127829 阅读:62 留言:0更新日期:2022-07-14 14:39
本公开实施例中提供了一种基于共有差异学习的深度多视图聚类方法、系统及设备,属于数据处理技术领域,具体包括:建立共有差异深度多视图特征学习网络;将多视图数据的每个视图分别连接共有信息提取网络和差异信息提取网络;将多视图数据的全部视图的共有信息提取网络输入共有信息学习模块进行训练直至收敛;将多视图数据的全部视图的共有信息提取网络和差异信息提取网络输入差异信息学习模块,通过正交约束得到多视图数据的每个视图的互补性特征;将一致性特征和全部互补性特征串联形成多视图融合特征;将多视图融合特征输入基于KL散度的聚类模型进行聚类。通过本公开的方案,提高了多视图数据初始特严重不均衡的情况下的聚类效果和适应性。下的聚类效果和适应性。下的聚类效果和适应性。

Deep multi view clustering method, system and equipment based on common difference learning

【技术实现步骤摘要】
基于共有差异学习的深度多视图聚类方法、系统及设备


[0001]本公开实施例涉及数据处理
,尤其涉及一种基于共有差异学习的深度多视图聚类方法、系统及设备。

技术介绍

[0002]目前,聚类根本思想是根据数据集中样本间的相似性将其划分成若干个类簇,同类间样本间相似度要小于异类间的样本相似度。传统的聚类算法主要是针对单视图数据,数据只有一组特征。当数据具有多组特征时,称为多视图数据。多视图数据不仅包含更多丰富且有用的信息,不同视图之间也会带来冗余信息。而目前大多数多视图聚类主要关注于最大化多视图的共有信息,忽视了各个视图上的差异性信息,即没有充分挖掘出多视图数据的互补信息;在多视图数据初始特严重不均衡的情况下,采用现有的方法可能会产生“木桶效应”,即所有视图的共有信息会朝着初始特征最差的视图靠拢,高质量视图的特征没有被充分利用,这也失去了数据从多视图描述的意义。
[0003]可见,亟需一种聚类效果和适应性高的基于共有差异学习的深度多视图聚类方法。

技术实现思路

[0004]有鉴于此,本公开实施例提供一种基于共有差异学习的深度多视图聚类方法、系统及设备,至少部分解决现有技术中存在聚类效果和利用高质量视图特征的适应性较差的问题。
[0005]第一方面,本公开实施例提供了一种基于共有差异学习的深度多视图聚类方法,包括:
[0006]步骤1,建立共有差异深度多视图特征学习网络,其中,所述共有差异深度多视图特征学习网络包括深度特征提取模块、共有信息学习模块和差异信息学习模块,所述深度特征提取模块包括共有信息提取网络和差异信息提取网络;
[0007]步骤2,获取多视图数据,并将所述多视图数据的每个视图分别连接所述共有信息提取网络和所述差异信息提取网络;
[0008]步骤3,将所述多视图数据的全部视图的共有信息提取网络输入共有信息学习模块进行训练直至收敛,得到所述多视图数据的一致性特征;
[0009]步骤4,将所述多视图数据的全部视图的共有信息提取网络和差异信息提取网络输入差异信息学习模块,通过正交约束得到所述多视图数据的每个视图的互补性特征;
[0010]步骤5,将所述一致性特征和全部所述互补性特征串联形成多视图融合特征;
[0011]步骤6,将所述多视图融合特征输入基于KL散度的聚类模型进行聚类。
[0012]根据本公开实施例的一种具体实现方式,所述共有信息学习模块包括生成对抗网络。
[0013]根据本公开实施例的一种具体实现方式,所述步骤3具体包括:
[0014]步骤3.1,所述共有信息学习模块将每个视图上的共有信息提取网络作为一个生成器G,最终得到M个生成器;
[0015]步骤3.2,将M个生成器生成的特征数据,传入到M分类的鉴别器D中;
[0016]步骤3.3,重复步骤3.1和步骤3.2,直到鉴别器无法区分特征数据对应的视图,得到所述一致性特征。
[0017]根据本公开实施例的一种具体实现方式,所述步骤5的串联方式为其中,h
i
表示第m个视图中的第i个样本的多视图融合特征,和分别表示在视图m上提取到的共有信息和差异信息。
[0018]根据本公开实施例的一种具体实现方式,所述步骤6具体包括:
[0019]将所述多视图融合特征输入基于KL散度的聚类模型迭代训练所述共有差异深度多视图特征学习网络和聚类网络,对所述多视图数据完成聚类。
[0020]第二方面,本公开实施例提供了一种基于共有差异学习的深度多视图聚类系统,包括:
[0021]建立模块,用于建立共有差异深度多视图特征学习网络,其中,所述共有差异深度多视图特征学习网络包括深度特征提取模块、共有信息学习模块和差异信息学习模块,所述深度特征提取模块包括共有信息提取网络和差异信息提取网络;
[0022]获取模块,用于获取多视图数据,并将所述多视图数据的每个视图分别连接所述共有信息提取网络和所述差异信息提取网络;
[0023]第一学习模块,用于将所述多视图数据的全部视图的共有信息提取网络输入共有信息学习模块进行训练直至收敛,得到所述多视图数据的一致性特征;
[0024]第二学习模块,用于将所述多视图数据的全部视图的共有信息提取网络和差异信息提取网络输入差异信息学习模块,通过正交约束得到所述多视图数据的每个视图的互补性特征;
[0025]融合模块,用于将所述一致性特征和全部所述互补性特征串联形成多视图融合特征;
[0026]聚类模块,用于将所述多视图融合特征输入基于KL散度的聚类模型进行聚类。
[0027]第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:
[0028]至少一个处理器;以及,
[0029]与该至少一个处理器通信连接的存储器;其中,
[0030]该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述第一方面或第一方面的任一实现方式中的基于共有差异学习的深度多视图聚类方法。
[0031]本公开实施例中的基于共有差异学习的深度多视图聚类方案,包括:步骤1,建立共有差异深度多视图特征学习网络,其中,所述共有差异深度多视图特征学习网络包括深度特征提取模块、共有信息学习模块和差异信息学习模块,所述深度特征提取模块包括共有信息提取网络和差异信息提取网络;步骤2,获取多视图数据,并将所述多视图数据的每个视图分别连接所述共有信息提取网络和所述差异信息提取网络;步骤3,将所述多视图数据的全部视图的共有信息提取网络输入共有信息学习模块进行训练直至收敛,得到所述多
视图数据的一致性特征;步骤4,将所述多视图数据的全部视图的共有信息提取网络和差异信息提取网络输入差异信息学习模块,通过正交约束得到所述多视图数据的每个视图的互补性特征;步骤5,将所述一致性特征和全部所述互补性特征串联形成多视图融合特征;步骤6,将所述多视图融合特征输入基于KL散度的聚类模型进行聚类。
[0032]本公开实施例的有益效果为:通过本公开的方案,多视图特征学习和多视图聚类策略充分利用多视图数据的一致性和互补信息,且同时减少不同视图间的冗余信息,提高了聚类效果和适应性。
附图说明
[0033]为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0034]图1为本公开实施例提供的一种基于共有差异学习的深度多视图聚类方法的流程示意图;
[0035]图2为本公开实施例提供的另一种基于共有差异学习的深度多视图聚类方法的流程示意图;
[0036]图3为本公开实施例提供的一种共有差异深度多视图特征学习网络的结构示意图;
[0037]图4为本公开实施例提供的一种深度特征提取模块的结构示意图;
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于共有差异学习的深度多视图聚类方法,其特征在于,包括:步骤1,建立共有差异深度多视图特征学习网络,其中,所述共有差异深度多视图特征学习网络包括深度特征提取模块、共有信息学习模块和差异信息学习模块,所述深度特征提取模块包括共有信息提取网络和差异信息提取网络;步骤2,获取多视图数据,并将所述多视图数据的每个视图分别连接所述共有信息提取网络和所述差异信息提取网络;步骤3,将所述多视图数据的全部视图的共有信息提取网络输入共有信息学习模块进行训练直至收敛,得到所述多视图数据的一致性特征;步骤4,将所述多视图数据的全部视图的共有信息提取网络和差异信息提取网络输入差异信息学习模块,通过正交约束得到所述多视图数据的每个视图的互补性特征;步骤5,将所述一致性特征和全部所述互补性特征串联形成多视图融合特征;步骤6,将所述多视图融合特征输入基于KL散度的聚类模型进行聚类。2.根据权利要求1所述的方法,其特征在于,所述共有信息学习模块包括生成对抗网络。3.根据权利要求2所述的方法,其特征在于,所述步骤3具体包括:步骤3.1,所述共有信息学习模块将每个视图上的共有信息提取网络作为一个生成器G,最终得到M个生成器;步骤3.2,将M个生成器生成的特征数据,传入到M分类的鉴别器D中;步骤3.3,重复步骤3.1和步骤3.2,直到鉴别器无法区分特征数据对应的视图,得到所述一致性特征。4.根据权利要求1所述的方法,其特征在于,所述步骤5的串联方式为其中,h
i
表示第m个视图中的第i个样本的多视图融合特征,和分别表示在视图m上提取到的共有信息和差...

【专利技术属性】
技术研发人员:李晓翠张新玉史庆宇
申请(专利权)人:湖南工商大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1