当前位置: 首页 > 专利查询>烟台大学专利>正文

一种基于深度学习的不完全多视图聚类方法及系统技术方案

技术编号:43074527 阅读:18 留言:0更新日期:2024-10-22 14:48
本发明专利技术涉及数据挖掘技术领域,尤其是涉及一种基于深度学习的不完全多视图聚类方法及系统。一种基于深度学习的不完全多视图聚类方法包括S1.获取跨视图训练集,包括完整数据集和不完整数据集;S2.构建聚类模型,包括编码器网络和解码器网络;S3.利用聚类模型对跨视图训练集进行特征提取和重构,并计算重构损失,对重构损失进行优化;S4.基于重构损失,分别利用完整数据集和不完整数据集对聚类模型进行训练;S5.利用训练好的聚类模型进行预测。本发明专利技术解决了对完整和不完整数据通过有效双层操作来提高聚类精度的问题。

【技术实现步骤摘要】

本专利技术涉及数据挖掘,尤其是涉及一种基于深度学习的不完全多视图聚类方法及系统


技术介绍

1、imvc 是不完全多视图聚类(incomplete multi-view clustering)的缩写。它是一种聚类方法,主要用于处理多视图数据中存在数据缺失的情况。

2、当前的 imvc 方法在实际应用中面临着一些挑战。由于现实生活中收集到的数据往往存在缺失,这导致了不完全多视图聚类问题的出现。当某些视图缺失时,多个视图之间相同实例的自然对齐属性就会被破坏,从而影响对互补和一致信息的探索。此外,修复后的缺失数据如果与缺失数据的语义不一致,将会导致聚类性能下降。

3、现有的 imvc 主要包括基于 encoder (编码器)的方法、基于高斯的方法、基于gcns (图卷积神经网络)的方法和基于对比的方法。基于 encoder 的方法通过从数据中提取特征表示,能够获得一致的特征表示来填补缺失数据,从而获得良好的聚类性能。基于高斯的方法利用生成式对抗网络对多视图数据中的缺失部分进行挖掘和填充,通过生成器和鉴别器的相互竞争,不断提高生成器的能力。本文档来自技高网...

【技术保护点】

1.一种基于深度学习的不完全多视图聚类方法,其特征在于,包括:

2.根据权利要求1所述的一种基于深度学习的不完全多视图聚类方法,其特征在于,所述利用聚类模型对跨视图训练集进行特征提取和重构包括:

3.根据权利要求2所述的一种基于深度学习的不完全多视图聚类方法,其特征在于,所述利用最优传输计算跨视图对齐损失,包括:

4.根据权利要求3所述的一种基于深度学习的不完全多视图聚类方法,其特征在于,所述利用最优输运对原型集中每个视图的原型进行对齐,包括:

5.根据权利要求1所述的一种基于深度学习的不完全多视图聚类方法,其特征在于,所述基于重构损失,分...

【技术特征摘要】

1.一种基于深度学习的不完全多视图聚类方法,其特征在于,包括:

2.根据权利要求1所述的一种基于深度学习的不完全多视图聚类方法,其特征在于,所述利用聚类模型对跨视图训练集进行特征提取和重构包括:

3.根据权利要求2所述的一种基于深度学习的不完全多视图聚类方法,其特征在于,所述利用最优传输计算跨视图对齐损失,包括:

4.根据权利要求3所述的一种基于深度学习的不完全多视图聚类方法,其特征在于,所述利用最优输运对原型集中每个视图的原型进行对齐,包括:

5.根据权利要求1所述的一种基于深度学习的不完全多视图聚类方法,其特征在于,所述基于重构损失,分别利用完整数据集和不完整数据集对聚类模型进行训练,包括:

6.根据权利要求5所述的一种基于深...

【专利技术属性】
技术研发人员:阎维青刘康龙蹇木伟徐金东刘兆伟王璇宋永超
申请(专利权)人:烟台大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1