基于共有差异学习的深度多视图聚类方法、系统及设备技术方案

技术编号：34127829 阅读：62 留言：0更新日期：2022-07-14 14:39

本公开实施例中提供了一种基于共有差异学习的深度多视图聚类方法、系统及设备，属于数据处理技术领域，具体包括：建立共有差异深度多视图特征学习网络；将多视图数据的每个视图分别连接共有信息提取网络和差异信息提取网络；将多视图数据的全部视图的共有信息提取网络输入共有信息学习模块进行训练直至收敛；将多视图数据的全部视图的共有信息提取网络和差异信息提取网络输入差异信息学习模块，通过正交约束得到多视图数据的每个视图的互补性特征；将一致性特征和全部互补性特征串联形成多视图融合特征；将多视图融合特征输入基于KL散度的聚类模型进行聚类。通过本公开的方案，提高了多视图数据初始特严重不均衡的情况下的聚类效果和适应性。下的聚类效果和适应性。下的聚类效果和适应性。

Deep multi view clustering method, system and equipment based on common difference learning

全部详细技术资料下载

【技术实现步骤摘要】
基于共有差异学习的深度多视图聚类方法、系统及设备

[0001]本公开实施例涉及数据处理
，尤其涉及一种基于共有差异学习的深度多视图聚类方法、系统及设备。

技术介绍

[0002]目前，聚类根本思想是根据数据集中样本间的相似性将其划分成若干个类簇，同类间样本间相似度要小于异类间的样本相似度。传统的聚类算法主要是针对单视图数据，数据只有一组特征。当数据具有多组特征时，称为多视图数据。多视图数据不仅包含更多丰富且有用的信息，不同视图之间也会带来冗余信息。而目前大多数多视图聚类主要关注于最大化多视图的共有信息，忽视了各个视图上的差异性信息，即没有充分挖掘出多视图数据的互补信息；在多视图数据初始特严重不均衡的情况下，采用现有的方法可能会产生“木桶效应”，即所有视图的共有信息会朝着初始特征最差的视图靠拢，高质量视图的特征没有被充分利用，这也失去了数据从多视图描述的意义。
[0003]可见，亟需一种聚类效果和适应性高的基于共有差异学习的深度多视图聚类方法。

技术实现思路

[0004]有鉴于此，本公开实施例提供一种基于共有差异学习的深度多视图聚类方法、系统及设备，至少部分解决现有技术中存在聚类效果和利用高质量视图特征的适应性较差的问题。
[0005]第一方面，本公开实施例提供了一种基于共有差异学习的深度多视图聚类方法，包括：
[0006]步骤1，建立共有差异深度多视图特征学习网络，其中，所述共有差异深度多视图特征学习网络包括深度特征提取模块、共有信息学习模块和差异信息学习模块，所述深度特征...

【技术保护点】

【技术特征摘要】
1.一种基于共有差异学习的深度多视图聚类方法，其特征在于，包括：步骤1，建立共有差异深度多视图特征学习网络，其中，所述共有差异深度多视图特征学习网络包括深度特征提取模块、共有信息学习模块和差异信息学习模块，所述深度特征提取模块包括共有信息提取网络和差异信息提取网络；步骤2，获取多视图数据，并将所述多视图数据的每个视图分别连接所述共有信息提取网络和所述差异信息提取网络；步骤3，将所述多视图数据的全部视图的共有信息提取网络输入共有信息学习模块进行训练直至收敛，得到所述多视图数据的一致性特征；步骤4，将所述多视图数据的全部视图的共有信息提取网络和差异信息提取网络输入差异信息学习模块，通过正交约束得到所述多视图数据的每个视图的互补性特征；步骤5，将所述一致性特征和全部所述互补性特征串联形成多视图融合特征；步骤6，将所述多视图融合特征输入基于KL散度的聚类模型进行聚类。2.根据权利要求1所述的方法，其特征在于,所述共有信息学习模块包括生成对抗网络。3.根据权利要求2所述的方法，其特征在于,所述步骤3具体包括：步骤3.1，所述共有信息学习模块将每个视图上的共有信息提取网络作为一个生成器G，最终得到M个生成器；步骤3.2，将M个生成器生成的特征数据，传入到M分类的鉴别器D中；步骤3.3，重复步骤3.1和步骤3.2，直到鉴别器无法区分特征数据对应的视图，得到所述一致性特征。4.根据权利要求1所述的方法，其特征在于,所述步骤5的串联方式为其中，h
i
表示第m个视图中的第i个样本的多视图融合特征，和分别表示在视图m上提取到的共有信息和差...

【专利技术属性】
技术研发人员：李晓翠，张新玉，史庆宇，
申请(专利权)人：湖南工商大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人