当前位置: 首页 > 专利查询>吉林大学专利>正文

一种基于深度网络模型的图像聚类方法技术

技术编号:38896412 阅读:6 留言:0更新日期:2023-09-22 14:17
本发明专利技术适用于图像处理技术领域,提供了一种基于深度网络模型的图像聚类方法,包括以下步骤:对数据集进行灰度归一化预处理,将像素值统一,裁剪为统一大小;把处理后的图像数据集分成训练集、验证集和测试集,增强图像,制作数据集视图,将每个图像数据生成两种增强视图,为数据赋予伪标签;构建深度网络模型;训练深度网络模型,生成训练模型;对训练模型进行测试。本发明专利技术中深度网络模型将类内紧密性与类间差异性相互融合,得到更多尺度、更丰富的特征,在聚类头模块实现精准的聚类分配;可以准确地进行层次相似性的提取,减少了因缺少相似性信息导致的类间冲突从而导致聚类性能不佳,提高聚类效率与聚类效果。提高聚类效率与聚类效果。提高聚类效率与聚类效果。

【技术实现步骤摘要】
一种基于深度网络模型的图像聚类方法


[0001]本专利技术属于图像处理
,尤其涉及一种基于深度网络模型的图像聚类方法 。

技术介绍

[0002]聚类是机器学习领域一种重要的无监督算法,是将给定的一批数据划分成两两不相干子集的过程。经过划分后的每个类中数据应该尽可能相似,不同类间差异性应尽可能大。通过划分数据集的过程寻找数据内在的分布结构与性质。经典的聚类算法有K

means和高斯混合模型等,计算效率较低,在高维数据上的性能较差。因此提出利用了降维技术,将原始数据映射到低维特征空间,可以有效提高聚类效率和效果。降维技术分为线性变换和非线性变换。线性变换如主成分分析和多维缩放,将数据从高维转至低维空间,然而线性模型难以深刻描述实际数据中蕴含的复杂分布结构。非线性映射主要有谱聚类、核方法和深度神经网络等。早期的深度聚类网络大多是利用自动编码器结构学习嵌入特征,再对嵌入特征进行聚类。近年来,自监督对比学习得到了广泛关注,它生成输入样本的增强版本,通过最小化两个增强数据点间距离,最大化与其他数据点的距离,学习到样本最具有代表性的特征表示。对比学习在很多领域,特别是计算机视觉方面得到了较大的成功,因此一些研究也尝试将对比学习用于聚类任务。例如CC,SCAN等。
[0003]利用自监督对比学习进行的聚类仍面临另一个明显的问题:遵循对比学习的基本框架,仅假设样本及其增幅在特征空间中应该是相似的,没有将潜在的类别信息纳入聚类,没有考虑到属于同一个类的不同图片之间的特征的相关性。对于聚类等无监督下游任务来讲,会比有监督的下游任务造成更严重的后果。因为拉远负对时拉远了实际上应该属于一个类的样本,可能会造成类间冲突,导致聚类效果不佳。

技术实现思路

[0004]本专利技术的目的在于提供一种基于深度网络模型的图像聚类方法 ,旨在解决上述
技术介绍
中提出的问题。
[0005]为实现上述目的,本专利技术提供如下技术方案:一种基于深度网络模型的图像聚类方法 ,包括以下步骤:步骤A、将采集的待聚类数据作为数据集,进行数据预处理:进行灰度归一化预处理,将像素值统一到[0,1]区间,裁剪为统一大小的图片;步骤B、把步骤A处理后的图像数据集分成三个部分,即训练集、验证集和测试集,增强步骤A处理后的图像,制作数据增强后的数据集视图,每个图像数据通过两种不同的增强方式生成两种增强视图,构建伪标签;步骤C、构建深度网络模型;步骤D、使用步骤B的训练集增强后视图对深度网络模型进行训练,生成训练模型;步骤E、使用步骤B的测试集增强后视图对步骤D中生成的训练模型进行测试。
[0006]进一步的,所述步骤B中,增强方式包括进行水平翻转、旋转不同的角度、随机裁剪
和缩放,每个图像数据随机选取两种增强方式生成两种增强视图。
[0007]进一步的,所述步骤C中,深度网络模型包括特征提取模块、类间差异性增强器头模块、类内紧密性增强器头模块以及聚类头模块。
[0008]进一步的,所述类间差异性增强器头模块、类内紧密性增强器头模块以及聚类头模块之间共享参数。
[0009]进一步的,所述步骤C的具体操作为:图像通过特征提取模块进行特征提取,将提取的特征送入类间差异性增强器头模块,类内紧密性增强器头模块提取特征,聚类头模块通过与类间差异性增强器头模块及类内紧密性增强器头模块共享参数的方式利用提取到的特征得到聚类分配。
[0010]进一步的,所述步骤C中:在特征提取模块中,输入数据首先经过一个7x7的卷积层,卷积层的步长为2,填充为3,输出通道数为64;卷积层的输出进入一个批归一化层和ReLU层;ReLU层的输出进入池化层,池化方式为最大池化,池化窗口大小为2;然后经过4个重复的残差块,每个残差块包括首先是一个3x3的卷积层,步长为1,输出通道数为64;紧接着是一个批归一化层和ReLU激活函数;接下来是一个3x3的卷积层,步长为1,输出通道数为64;紧接着是一个批归一化层;经过两个卷积层之后将输入与第二个卷积层的输出相加,形成残差连接,并对残差连接的结果进行ReLU激活;最后一个残差块的输出进入池化层,池化方式为全局平均池化,最终得到局部特征;然后该局部特征输入到类间差异性增强器头模块、类内紧密性增强器头模块以及聚类头模块中;在类间差异性增强器头模块和类内紧密性增强器头模块中,输入特征的处理方式相同,具体为:输入特征首先经过一个线性层和一个ReLU层,ReLU层的输出再进入一个BN层和一个线性层;线性层的输出进入一个归一化层,得到局部特征;在聚类头模块中,输入特征首先经过一个线性层和一个ReLU层,ReLU层的输出再进入一个线性层,线性层的输出进入一个归一化层,归一化层的输出进入全连接层,使用softmax激活函数生成聚类分配。
[0011]进一步的,所述步骤D的具体操作为:D1、使用步骤B中得到的训练集增强视图,对深度网络模型进行训练,设置初始学习率0.4,学习率衰减系数为0.0001,batch_size为256;优化器为SGD优化器。
[0012]进一步的,所述步骤E的具体操作为:使用步骤B的测试集增强后视图,对已经训练好的模型进行测试,预测聚类分配。
[0013]与现有技术相比,本专利技术的有益效果是:该基于深度网络模型的图像聚类方法,通过设置由四个模块组成的深度网络模型,分别是特征提取模块、类间差异性增强器头模块、类内紧密性增强器头模块和聚类头模块。特征提取模块可以高效地通过卷积提取局部特征,类间差异性增强器头模块和类内紧密性增强器头模块进一步提取特征,聚类头模块得到聚类分配。深度网络模型将类内紧密性与类间差异性相互融合,得到更多尺度、更丰富的特征,在聚类头模块最终实现精准的聚类分配。该模型可以实现准确地进行层次相似性的提取,减少了因缺少相似性信息导致的类间冲突从而导致聚类性能不佳,提高聚类效率与聚类效果。
附图说明
[0014]图1为本专利技术的流程图。
具体实施方式
[0015]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。
[0016]以下结合具体实施例对本专利技术的具体实现进行详细描述。
[0017]本专利技术一个实施例提供的一种基于深度网络模型的图像聚类方法 ,包括以下步骤:步骤A、将采集的待聚类数据作为数据集,进行数据预处理:进行灰度归一化预处理,将像素值统一到[0,1]区间,裁剪为统一大小的图片;步骤B、把步骤A处理后的图像数据集分成三个部分,即训练集、验证集和测试集,增强步骤A处理后的图像,制作数据增强后的数据集视图,每个图像数据通过两种不同的增强方式生成两种增强视图,构建伪标签;步骤C、构建深度网络模型;步骤D、使用步骤B的训练集增强后视图对深度网络模型进行训练,生成训练模型;步骤E、使用步骤B的测试集增强后视图对步骤D中生成的训练模型进行测试。
[0018]作为本专利技术的一种优选实施例,所述步骤B中,增强方式包括进行水本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度网络模型的图像聚类方法,其特征在于,包括以下步骤:步骤A、将采集的待聚类数据作为数据集,进行数据预处理:进行灰度归一化预处理,将像素值统一到[0,1]区间,裁剪为统一大小的图片;步骤B、把步骤A处理后的图像数据集分成三个部分,即训练集、验证集和测试集,增强步骤A处理后的图像,制作数据增强后的数据集视图,每个图像数据通过两种不同的增强方式生成两种增强视图,构建伪标签;步骤C、构建深度网络模型;步骤D、使用步骤B的训练集增强后视图对深度网络模型进行训练,生成训练模型;步骤E、使用步骤B的测试集增强后视图对步骤D中生成的训练模型进行测试。2.根据权利要求1所述的基于深度网络模型的图像聚类方法,其特征在于,所述步骤B中,增强方式包括进行水平翻转、旋转不同的角度、随机裁剪和缩放,每个图像数据随机选取两种增强方式生成两种增强视图。3.根据权利要求1所述的基于深度网络模型的图像聚类方法,其特征在于,所述步骤C中,深度网络模型包括特征提取模块、类间差异性增强器头模块、类内紧密性增强器头模块以及聚类头模块。4.根据权利要求3所述的基于深度网络模型的图像聚类方法,其特征在于,所述类间差异性增强器头模块、类内紧密性增强器头模块以及聚类头模块之间共享参数。5.根据权利要求4所述的基于深度网络模型的图像聚类方法,其特征在于,所述步骤C的具体操作为:图像通过特征提取模块进行特征提取,将提取的特征送入类间差异性增强器头模块,类内紧密性增强器头模块提取特征,聚类头模块通过与类间差异性增强器头模块及类内紧密性增强器头模块共享参数的方式利用提取到的特征得到聚类分配。6.根据权利要求3所述的基于深度网络模型的图像聚类方法,其特征在于,所述步骤C中:在特征提取模块中,输入数据首先经过一个7x7的卷...

【专利技术属性】
技术研发人员:周柚李沅书王鏐璞杜伟肖钰彬吴翾赵鹏
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1