【技术实现步骤摘要】
基于共有差异学习的深度多视图聚类方法、系统及设备
[0001]本公开实施例涉及数据处理
,尤其涉及一种基于共有差异学习的深度多视图聚类方法、系统及设备。
技术介绍
[0002]目前,聚类根本思想是根据数据集中样本间的相似性将其划分成若干个类簇,同类间样本间相似度要小于异类间的样本相似度。传统的聚类算法主要是针对单视图数据,数据只有一组特征。当数据具有多组特征时,称为多视图数据。多视图数据不仅包含更多丰富且有用的信息,不同视图之间也会带来冗余信息。而目前大多数多视图聚类主要关注于最大化多视图的共有信息,忽视了各个视图上的差异性信息,即没有充分挖掘出多视图数据的互补信息;在多视图数据初始特严重不均衡的情况下,采用现有的方法可能会产生“木桶效应”,即所有视图的共有信息会朝着初始特征最差的视图靠拢,高质量视图的特征没有被充分利用,这也失去了数据从多视图描述的意义。
[0003]可见,亟需一种聚类效果和适应性高的基于共有差异学习的深度多视图聚类方法。
技术实现思路
[0004]有鉴于此,本公开实施例提供一 ...
【技术保护点】
【技术特征摘要】
1.一种基于共有差异学习的深度多视图聚类方法,其特征在于,包括:步骤1,建立共有差异深度多视图特征学习网络,其中,所述共有差异深度多视图特征学习网络包括深度特征提取模块、共有信息学习模块和差异信息学习模块,所述深度特征提取模块包括共有信息提取网络和差异信息提取网络;步骤2,获取多视图数据,并将所述多视图数据的每个视图分别连接所述共有信息提取网络和所述差异信息提取网络;步骤3,将所述多视图数据的全部视图的共有信息提取网络输入共有信息学习模块进行训练直至收敛,得到所述多视图数据的一致性特征;步骤4,将所述多视图数据的全部视图的共有信息提取网络和差异信息提取网络输入差异信息学习模块,通过正交约束得到所述多视图数据的每个视图的互补性特征;步骤5,将所述一致性特征和全部所述互补性特征串联形成多视图融合特征;步骤6,将所述多视图融合特征输入基于KL散度的聚类模型进行聚类。2.根据权利要求1所述的方法,其特征在于,所述共有信息学习模块包括生成对抗网络。3.根据权利要求2所述的方法,其特征在于,所述步骤3具体包括:步骤3.1,所述共有信息学习模块将每个视图上的共有信息提取网络作为一个生成器G,最终得到M个生成器;步骤3.2,将M个生成器生成的特征数据,传入到M分类的鉴别器D中;步骤3.3,重复步骤3.1和步骤3.2,直到鉴别器无法区分特征数据对应的视图,得到所述一致性特征。4.根据权利要求1所述的方法,其特征在于,所述步骤5的串联方式为其中,h
i
表示第m个视图中的第i个样本的多视图融合特征,和分别表示在视图m上提取到的共有信息和差...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。