一种基于深度网络模型的图像聚类方法技术

技术编号：38896412 阅读：6 留言：0更新日期：2023-09-22 14:17

本发明专利技术适用于图像处理技术领域，提供了一种基于深度网络模型的图像聚类方法，包括以下步骤：对数据集进行灰度归一化预处理，将像素值统一，裁剪为统一大小；把处理后的图像数据集分成训练集、验证集和测试集，增强图像，制作数据集视图，将每个图像数据生成两种增强视图，为数据赋予伪标签；构建深度网络模型；训练深度网络模型，生成训练模型；对训练模型进行测试。本发明专利技术中深度网络模型将类内紧密性与类间差异性相互融合，得到更多尺度、更丰富的特征，在聚类头模块实现精准的聚类分配；可以准确地进行层次相似性的提取，减少了因缺少相似性信息导致的类间冲突从而导致聚类性能不佳，提高聚类效率与聚类效果。提高聚类效率与聚类效果。提高聚类效率与聚类效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度网络模型的图像聚类方法

[0001]本专利技术属于图像处理
，尤其涉及一种基于深度网络模型的图像聚类方法。

技术介绍

[0002]聚类是机器学习领域一种重要的无监督算法，是将给定的一批数据划分成两两不相干子集的过程。经过划分后的每个类中数据应该尽可能相似，不同类间差异性应尽可能大。通过划分数据集的过程寻找数据内在的分布结构与性质。经典的聚类算法有K
‑
means和高斯混合模型等，计算效率较低，在高维数据上的性能较差。因此提出利用了降维技术，将原始数据映射到低维特征空间，可以有效提高聚类效率和效果。降维技术分为线性变换和非线性变换。线性变换如主成分分析和多维缩放，将数据从高维转至低维空间，然而线性模型难以深刻描述实际数据中蕴含的复杂分布结构。非线性映射主要有谱聚类、核方法和深度神经网络等。早期的深度聚类网络大多是利用自动编码器结构学习嵌入特征，再对嵌入特征进行聚类。近年来，自监督对比学习得到了广泛关注，它生成输入样本的增强版本，通过最小化两个增强数据点间距离，最大化与其他数据点的距离，学习到样本最具有代表性的特征表示。对比学习在很多领域，特别是计算机视觉方面得到了较大的成功，因此一些研究也尝试将对比学习用于聚类任务。例如CC，SCAN等。
[0003]利用自监督对比学习进行的聚类仍面临另一个明显的问题：遵循对比学习的基本框架，仅假设样本及其增幅在特征空间中应该是相似的，没有将潜在的类别信息纳入聚类，没有考虑到属于同一个类的不同图片之间的特征的相关性。对于聚类等无监督下游任务...

【技术保护点】

【技术特征摘要】
1.一种基于深度网络模型的图像聚类方法，其特征在于，包括以下步骤：步骤A、将采集的待聚类数据作为数据集，进行数据预处理：进行灰度归一化预处理，将像素值统一到[0,1]区间，裁剪为统一大小的图片；步骤B、把步骤A处理后的图像数据集分成三个部分，即训练集、验证集和测试集，增强步骤A处理后的图像，制作数据增强后的数据集视图，每个图像数据通过两种不同的增强方式生成两种增强视图，构建伪标签；步骤C、构建深度网络模型；步骤D、使用步骤B的训练集增强后视图对深度网络模型进行训练，生成训练模型；步骤E、使用步骤B的测试集增强后视图对步骤D中生成的训练模型进行测试。2.根据权利要求1所述的基于深度网络模型的图像聚类方法，其特征在于，所述步骤B中，增强方式包括进行水平翻转、旋转不同的角度、随机裁剪和缩放，每个图像数据随机选取两种增强方式生成两种增强视图。3.根据权利要求1所述的基于深度网络模型的图像聚类方法，其特征在于，所述步骤C中，深度网络模型包括特征提取模块、类间差异性增强器头模块、类内紧密性增强器头模块以及聚类头模块。4.根据权利要求3所述的基于深度网络模型的图像聚类方法，其特征在于，所述类间差异性增强器头模块、类内紧密性增强器头模块以及聚类头模块之间共享参数。5.根据权利要求4所述的基于深度网络模型的图像聚类方法，其特征在于，所述步骤C的具体操作为：图像通过特征提取模块进行特征提取，将提取的特征送入类间差异性增强器头模块，类内紧密性增强器头模块提取特征，聚类头模块通过与类间差异性增强器头模块及类内紧密性增强器头模块共享参数的方式利用提取到的特征得到聚类分配。6.根据权利要求3所述的基于深度网络模型的图像聚类方法，其特征在于，所述步骤C中：在特征提取模块中，输入数据首先经过一个7x7的卷...

【专利技术属性】
技术研发人员：周柚，李沅书，王鏐璞，杜伟，肖钰彬，吴翾，赵鹏，
申请(专利权)人：吉林大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人