图像聚类方法、图像聚类模型的训练方法和装置制造方法及图纸

技术编号：33304853 阅读：16 留言：0更新日期：2022-05-06 12:14

本申请涉及一种图像聚类方法、图像聚类模型的训练方法和装置，其中，该图像聚类方法包括：将待聚类的多个待处理图像输入训练后的图像聚类模型，利用图像聚类模型进行如下处理：对各个待处理图像进行特征处理，得到各个待处理特征对应的编码特征；对各个待处理特征对应的编码特征进行聚类处理，得到多个待处理图像的聚类结果。通过本申请，解决了相关技术中基于原始特征进行相似度计算，多算法的耗时、内存等资源占用较高的问题，搭建多算法聚类框架实现了聚档的应用，而且提高聚档计算效率，降低资源占用。低资源占用。低资源占用。

全部详细技术资料下载

【技术实现步骤摘要】
图像聚类方法、图像聚类模型的训练方法和装置

[0001]本申请涉及数据处理
，特别是涉及图像聚类方法、图像聚类模型的训练方法和装置。

技术介绍

[0002]人脸识别是一种基于面部特征进行身份认证的技术，一般的方案为人脸检测、关键点定位、特征提取，通过特定的度量(如欧式距离、余弦相似度等)计算特征间的相似度。传统的人脸识别采用有监督的方式实现，近来另一种无监督的方式逐渐流行，即人脸聚类。人脸聚类关注如何将大量的无标签数据中的同一人汇聚到一起，进而开展例如轨迹查询之类的后续应用。常用的方法如k
‑
means聚类算法、密度聚类算法、层次聚类算法等。但是由于城市级数据规模庞大、场景复杂，采用单一算法实现人脸聚档普遍存在多档、漏档等情况。因此需要将多算法进行融合使用，即对于同一目标，融合多算法的结果获得更完整的聚类档案，可以一定程度上提高整体的效果。
[0003]目前，多算法融合的方案是基于不同算法在测试集上的准确率，获得不同算法特征的权重，之后通过加权相似度融合计算整体相似度，主要用于人脸识别场景。这种方案的缺点在于，基于原始特征进行相似度计算，多算法的耗时、内存等资源占用较高。
[0004]针对相关技术中基于原始特征进行相似度计算，多算法的耗时、内存等资源占用较高的问题，目前还没有提出有效的解决方案。

技术实现思路

[0005]在本实施例中提供了一种图像聚类方法、图像聚类模型的训练方法和装置，以解决相关技术中基于原始特征进行相似度计算，多算法的耗时、内存等资源占用较高...

【技术保护点】

【技术特征摘要】
1.一种图像聚类方法，其特征在于，包括：将待聚类的多个待处理图像输入训练后的图像聚类模型，利用所述图像聚类模型进行如下处理：对各个所述待处理图像进行特征处理，得到各个所述待处理特征对应的编码特征；其中，所述编码特征是对对应的待处理图像的多个原始特征进行编码得到的，所述多个原始特征是利用各类聚类算法对所述对应的待处理图像进行特征提取得到的；对所述各个待处理特征对应的编码特征进行聚类处理，得到所述多个待处理图像的聚类结果。2.根据权利要求1所述的图像聚类方法，其特征在于，所述聚类图像模型是通过如下方式进行训练得到的：确定多个样本图像；利用训练中的图像聚类模型对各个所述样本图像进行特征处理，得到各个所述样本图像对应的所述编码特征；对各个所述样本图像对应的所述编码特征进行聚类处理；对聚类处理的结果进行度量学习，以完成聚类图像模型的训练。3.根据权利要求2所述的图像聚类方法，其特征在于，所述样本图像至少包括两个种类的样本图像。4.根据权利要求2所述的图像聚类方法，其特征在于，所述编码特征是根据编码器和预设编码特征的维度，对对应的样本图像的多个原始特征进行无监督自编码得到。5.根据权利要求4所述的图像聚类方法，其特征在于，所述编码特征的维度为所述原始特征的维度除以聚类算法的种类。6.根据权利要求2所述的图像聚类方法，其特征在于，所述对聚类处理的结果进行度量学习，以完成聚类图像模型的训练，包括：对聚类处理的结果进行度量学习，在满足预设损失函数时，以完成聚类图像模型的训练；所述损失函数为对比损失函数。7.根据权利要求1所述的图像聚类方法，其特征在于，还包括：利用训练后的所述聚类图像模型，对待处理图像进行类中心和相似度计算，得到聚档结果。8.一种图像聚类模型的训练方法，其特征在于，包括：确定多个样本图...

【专利技术属性】
技术研发人员：郝敬松，朱树磊，殷俊，
申请(专利权)人：浙江大华技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人