图像聚类方法、图像聚类模型的训练方法和装置制造方法及图纸

技术编号:33304853 阅读:16 留言:0更新日期:2022-05-06 12:14
本申请涉及一种图像聚类方法、图像聚类模型的训练方法和装置,其中,该图像聚类方法包括:将待聚类的多个待处理图像输入训练后的图像聚类模型,利用图像聚类模型进行如下处理:对各个待处理图像进行特征处理,得到各个待处理特征对应的编码特征;对各个待处理特征对应的编码特征进行聚类处理,得到多个待处理图像的聚类结果。通过本申请,解决了相关技术中基于原始特征进行相似度计算,多算法的耗时、内存等资源占用较高的问题,搭建多算法聚类框架实现了聚档的应用,而且提高聚档计算效率,降低资源占用。低资源占用。低资源占用。

【技术实现步骤摘要】
图像聚类方法、图像聚类模型的训练方法和装置


[0001]本申请涉及数据处理
,特别是涉及图像聚类方法、图像聚类模型的训练方法和装置。

技术介绍

[0002]人脸识别是一种基于面部特征进行身份认证的技术,一般的方案为人脸检测、关键点定位、特征提取,通过特定的度量(如欧式距离、余弦相似度等)计算特征间的相似度。传统的人脸识别采用有监督的方式实现,近来另一种无监督的方式逐渐流行,即人脸聚类。人脸聚类关注如何将大量的无标签数据中的同一人汇聚到一起,进而开展例如轨迹查询之类的后续应用。常用的方法如k

means聚类算法、密度聚类算法、层次聚类算法等。但是由于城市级数据规模庞大、场景复杂,采用单一算法实现人脸聚档普遍存在多档、漏档等情况。因此需要将多算法进行融合使用,即对于同一目标,融合多算法的结果获得更完整的聚类档案,可以一定程度上提高整体的效果。
[0003]目前,多算法融合的方案是基于不同算法在测试集上的准确率,获得不同算法特征的权重,之后通过加权相似度融合计算整体相似度,主要用于人脸识别场景。这种方案的缺点在于,基于原始特征进行相似度计算,多算法的耗时、内存等资源占用较高。
[0004]针对相关技术中基于原始特征进行相似度计算,多算法的耗时、内存等资源占用较高的问题,目前还没有提出有效的解决方案。

技术实现思路

[0005]在本实施例中提供了一种图像聚类方法、图像聚类模型的训练方法和装置,以解决相关技术中基于原始特征进行相似度计算,多算法的耗时、内存等资源占用较高的问题。
[0006]第一个方面,在本实施例中提供了一种图像聚类方法,包括:
[0007]将待聚类的多个待处理图像输入训练后的图像聚类模型,利用所述图像聚类模型进行如下处理:
[0008]对各个所述待处理图像进行特征处理,得到各个所述待处理特征对应的编码特征;其中,所述编码特征是对对应的待处理图像的多个原始特征进行编码得到的,所述多个原始特征是利用各类聚类算法对所述对应的待处理图像进行特征提取得到的;
[0009]对所述各个待处理特征对应的编码特征进行聚类处理,得到所述多个待处理图像的聚类结果。
[0010]在其中的一些实施例中,所述聚类图像模型是通过如下方式进行训练得到的:
[0011]确定多个样本图像;
[0012]利用训练中的图像聚类模型对各个所述样本图像进行特征处理,得到各个所述样本图像对应的所述编码特征;
[0013]对各个所述样本图像对应的所述编码特征进行聚类处理;
[0014]对聚类处理的结果进行度量学习,以完成聚类图像模型的训练。
[0015]在其中的一些实施例中,所述样本图像至少包括两个种类的样本图像。
[0016]在其中的一些实施例中,所述编码特征是根据编码器和预设编码特征的维度,对对应的样本图像的多个原始特征进行无监督自编码得到。
[0017]在其中的一些实施例中,所述编码特征的维度为所述原始特征的维度除以聚类算法的种类。
[0018]在其中的一些实施例中,所述对聚类处理的结果进行度量学习,以完成聚类图像模型的训练,包括:
[0019]对聚类处理的结果进行度量学习,在满足预设损失函数时,以完成聚类图像模型的训练;所述损失函数为对比损失函数。
[0020]在其中的一些实施例中,所述的图像聚类方法,还包括:
[0021]利用训练后的所述聚类图像模型,对待处理图像进行类中心和相似度计算,得到聚档结果。
[0022]第二个方面,在本实施例中提供了一种图像聚类模型的训练方法,包括:
[0023]确定多个样本图像;
[0024]利用训练中的图像聚类模型对各个所述样本图像进行特征处理,得到各个所述样本图像对应的编码特征;
[0025]对各个所述样本图像对应的所述编码特征进行聚类处理;
[0026]对聚类处理的结果进行度量学习,以完成聚类图像模型的训练。
[0027]第三个方面,在本实施例中提供了一种图像聚类装置,包括:聚类应用模块;
[0028]所述聚类应用模块,用于将待聚类的多个待处理图像输入训练后的图像聚类模型,利用所述图像聚类模型进行如下处理:
[0029]对各个所述待处理图像进行特征处理,得到各个所述待处理特征对应的编码特征;其中,所述编码特征是对对应的待处理图像的多个原始特征进行编码得到的,所述多个原始特征是利用各类聚类算法对所述对应的待处理图像进行特征提取得到的;
[0030]对所述各个待处理特征对应的编码特征进行聚类处理,得到所述多个待处理图像的聚类结果。
[0031]第四个方面,在本实施例中提供了一种图像聚类模型的训练装置,包括:确定模块、特征处理模块、聚类处理模块以及度量学习模块;
[0032]所述确定模块,用于确定多个样本图像;
[0033]所述特征处理模块,用于利用训练中的图像聚类模型对各个所述样本图像进行特征处理,得到各个所述样本图像对应的编码特征;
[0034]所述聚类处理模块,用于对各个所述样本图像对应的所述编码特征进行聚类处理;
[0035]所述度量学习模块,用于对聚类处理的结果进行度量学习,以完成聚类图像模型的训练。
[0036]第五个方面,在本实施例中提供了一种电子装置,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面所述的图像聚类方法或第二个方面所述的图像聚类模型的训练方法。
[0037]第六个方面,在本实施例中提供了一种存储介质,其上存储有计算机程序,该程序
被处理器执行时实现上述第一个方面所述的图像聚类方法或第二个方面所述的图像聚类模型的训练方法。
[0038]与相关技术相比,在本实施例中提供的图像聚类方法、图像聚类模型的训练方法和装置,通过将待聚类的多个待处理图像输入训练后的图像聚类模型,利用图像聚类模型进行如下处理:对各个待处理图像进行特征处理,得到各个待处理特征对应的编码特征;其中,编码特征是对对应的待处理图像的多个原始特征进行编码得到的,多个原始特征是利用各类聚类算法对对应的待处理图像进行特征提取得到的;对各个待处理特征对应的编码特征进行聚类处理,得到多个待处理图像的聚类结果;解决了相关技术中基于原始特征进行相似度计算,多算法的耗时、内存等资源占用较高的问题,搭建多算法聚类框架实现了聚类的应用,而且提高聚类计算效率,降低资源占用。
[0039]本申请的一个或多个实施例的细节在以下附图和描述中提出,以使本申请的其他特征、目的和优点更加简明易懂。
附图说明
[0040]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0041]图1是本申请一实施例提供的图像聚类方法的终端设备的硬件结构框图;
[0042]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像聚类方法,其特征在于,包括:将待聚类的多个待处理图像输入训练后的图像聚类模型,利用所述图像聚类模型进行如下处理:对各个所述待处理图像进行特征处理,得到各个所述待处理特征对应的编码特征;其中,所述编码特征是对对应的待处理图像的多个原始特征进行编码得到的,所述多个原始特征是利用各类聚类算法对所述对应的待处理图像进行特征提取得到的;对所述各个待处理特征对应的编码特征进行聚类处理,得到所述多个待处理图像的聚类结果。2.根据权利要求1所述的图像聚类方法,其特征在于,所述聚类图像模型是通过如下方式进行训练得到的:确定多个样本图像;利用训练中的图像聚类模型对各个所述样本图像进行特征处理,得到各个所述样本图像对应的所述编码特征;对各个所述样本图像对应的所述编码特征进行聚类处理;对聚类处理的结果进行度量学习,以完成聚类图像模型的训练。3.根据权利要求2所述的图像聚类方法,其特征在于,所述样本图像至少包括两个种类的样本图像。4.根据权利要求2所述的图像聚类方法,其特征在于,所述编码特征是根据编码器和预设编码特征的维度,对对应的样本图像的多个原始特征进行无监督自编码得到。5.根据权利要求4所述的图像聚类方法,其特征在于,所述编码特征的维度为所述原始特征的维度除以聚类算法的种类。6.根据权利要求2所述的图像聚类方法,其特征在于,所述对聚类处理的结果进行度量学习,以完成聚类图像模型的训练,包括:对聚类处理的结果进行度量学习,在满足预设损失函数时,以完成聚类图像模型的训练;所述损失函数为对比损失函数。7.根据权利要求1所述的图像聚类方法,其特征在于,还包括:利用训练后的所述聚类图像模型,对待处理图像进行类中心和相似度计算,得到聚档结果。8.一种图像聚类模型的训练方法,其特征在于,包括:确定多个样本图...

【专利技术属性】
技术研发人员:郝敬松朱树磊殷俊
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1