基于复合子空间的图像聚类方法技术

技术编号:38863980 阅读:31 留言:0更新日期:2023-09-17 10:04
本发明专利技术公开了基于复合子空间的图像聚类方法,具体按照以下步骤实施:步骤1、预训练卷积自动编码器;步骤2、训练复合子空间图像聚类网络;步骤3、应用谱聚类得到聚类结果。本发明专利技术采用无监督学习的方式实现图像聚类,通过同时学习输入空间和潜在空间中的自表达系数获得一个明确的非线性映射,将输入样本嵌入到相应的深度表征中,从而更好地捕获子空间结构,提高聚类精度。高聚类精度。高聚类精度。

【技术实现步骤摘要】
基于复合子空间的图像聚类方法


[0001]本专利技术属于图像聚类方法
,具体涉及基于复合子空间的图像聚类方法。

技术介绍

[0002]随着数据采集、存储和处理技术的进步,互联网中的图像呈爆炸式增长。尽管现代机器学习技术的发展在数据挖掘方面取得了巨大的成功,但这些方法通常需要大量标注的数据来实现高性能的模型训练,而这些标注数据往往是昂贵且耗时的,需要大量的人力和专业知识,因此,从未标记的大数据中提取模式和聚类已经成为一个重要的开放性问题。
[0003]子空间聚类是解决无监督聚类问题的有效技术,具有坚实的理论基础和出色的聚类性能,该技术在多个机器学习应用领域得到广泛应用,包括运动分割、人脸聚类、电影推荐等,其主要目标是将一组从低维子空间中提取的数据样本划分为不相交的簇,使每个簇内的样本属于同一子空间,这类算法可以挖掘数据的内在结构,并从中发现潜在的模式和关联关系。
[0004]以往的子空间聚类方法通常先利用自动编码器获得原始数据的潜在表示,然后使用一层全连接层来模拟数据的自表达特性,得到自表达矩阵,最后应用谱聚类算法获得聚类结本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于复合子空间的图像聚类方法,其特征在于:具体按照以下步骤实施:步骤1、预训练卷积自动编码器;步骤2、训练复合子空间图像聚类网络;步骤3、应用谱聚类得到聚类结果。2.根据权利要求1所述的基于复合子空间的图像聚类方法,其特征在于:所述步骤1具体为:对读取的图像数据进行预处理,以数据重构为目标,以预处理好的图像数据作为输入数据,使用ADAM算法优化卷积自动编码器,当解码器能够很好地重构输入数据时结束训练,保存卷积自动编码器的网络参数;图像数据预处理是对图像数据进行归一化处理,若图像过大,则还需要使用PCA进行降维处理,用X=[x1,x2,...,x
n
]表示预处理的图像数据的集合,Y=[y1,y2,...,y
n
]表示X对应的标签集合,其中,x
i
∈R
D
表示x
i
处于D维特征空间中,y
i
是一个标量表示数据x
i
的标签。3.根据权利要求2所述的基于复合子空间的图像聚类方法,其特征在于:所述卷积自动编码器的预训练具体按照以下步骤实施:步骤1、随机初始化卷积自动编码器的网络参数;步骤2、将批量大小设置为100,采用ADAM优化器,以重构为目标,在GPU上对卷积自动编码器进行训练;步骤3、待训练达到终止条件后,结束训练,保存卷积自动编码器的网络参数。4.根据权利要求1所述的基于复合子空间的图像聚类方法,其特征在于:所述步骤2具体为:构建复合子空间图像聚类网络,将所述步骤1中保存的网络参数作为初始值加载到复合子空间图像聚类网络中,随机初始化网络中的其他参数,以损失函数目标进行训练,训练复合子空间图像聚类网络,得到训练好的复合子空间图像聚类网络。5.根据权利要求4所述的基于复合子空间的图像聚类方法,其特征在于:所述复合子空间图像聚类网络包括特征提取模块和自表达模块,其中,特征提取模块是步骤1中的卷积自动编码器,自表达模块采用一层没有偏置和激活函数的全连接层实现,该层的输入有n个神经元是编码器的输出,该层的输出是解码器的输入,U=[u1,u2,...,u
n
]是编码器的输出,表示X对应的潜在表示,u
i
∈R
P
表示u...

【专利技术属性】
技术研发人员:杨博李猛刘姿邑
申请(专利权)人:西安工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1