【技术实现步骤摘要】
一种深度图像聚类方法、系统及存储介质
[0001]本专利技术涉及图像处理
,尤其涉及一种深度图像聚类方法、系统及存储介质。
技术介绍
[0002]随着信息技术的快速发展,信息产生渠道日益多元化,数据的爆炸式增长为各行业领域高质量发展带来了丰富的数据支撑,如何从繁杂的数据中分析出高价值模式信息是各行业高质量发展的前提。如今,图像数据是各行业产生最多,最常见的一类数据。如何从图像数据中挖掘出有用的模式信息已经变得非常重要。事实上,各行业产生的原始图像数据往往缺少标签信息,此外由于人工标注带来的成本限制和主观操作因素,以无监督为特点的图像聚类成为数据分析的首要选择。作为人工智能,机器学习,数据挖掘,模式识别领域中的关键技术之一,图像聚类旨在将目标图像划分为不同的群组,使同一群组的图像之间具有高度的同质性,而不同群组的图像具有最大的差异性,可快速约减原始数据间的冗余和无用信息,揭示出数据潜在的模式或结构,有助于数据的深度处理和再加工,也是众多以数据为中心的高阶任务处理原始数据的基础方法。由于具有无监督特性,图像聚类被广泛应用于 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种深度图像聚类方法,其特征在于,包括以下步骤:步骤一,将含有n个样本的图像数据集输入编码器;步骤二,编码器将步骤一输入的原始图像转化为低维嵌入特征,再分别输出给解码器和维度约减模块,解码器将低维嵌入特征恢复为原始图像,维度约减模块将低维嵌入特征转化为聚类友好的二维表示,形成聚类空间,并输出给聚类划分模块;步骤三,聚类划分模块根据每个样本的低维嵌入特征将图像数据集中的n个样本划分为K个子簇,得到聚类结果;步骤四,网络开始优化,并不断更新网络,直到满足迭代停止条件,否则返回步骤一。2.根据权利要求1所述的深度图像聚类方法,其特征在于,所述步骤二中,所述编码器运行如下步骤:步骤1,由Patch
‑
Embedding层将输入的原始图像分割为多个补丁块,并利用卷积运算将每个补丁块转换为一维向量;步骤2,将步骤1转换的一维向量顺序送入线性组合、Encoding
‑
layer层,得到原始图像的低维嵌入特征;步骤3,将步骤2获得的低维嵌入特征分别输出给解码器和维度约减模块。3.根据权利要求2所述的深度图像聚类方法,其特征在于,所述编码器由一个Patch
‑
Embedding层、5个Transformer构成的线性组合,一个Encoding
‑
layer层组成。4.根据权利要求1所述的深度图像聚类方法,其特征在于,所述步骤二中,所述解码器将得到的重构损失用于训练网络,重构损失定义如下:(1)其中,表示图像i,g
u
表示解码器,表示数据样本i的图像增强版本,f
w
表示编码器,n表示样本个数。5.根据权利要求1所述的深度图像聚类方法,其特征在于,所述步骤二中,所述维度约减模块中的维度约减损失定义如下:(2)和分别代表输入的嵌入特征和输出的聚类特征的整体分布,通过最小化两个分布的KL散度得到友好的二维特征;其中表示嵌入特征z
i
技术研发人员:张瑞霖,王鸿鹏,郑海阳,谢甜,
申请(专利权)人:哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。