一种图片聚类方法、装置及存储介质制造方法及图纸

技术编号:31171273 阅读:11 留言:0更新日期:2021-12-04 13:34
本发明专利技术公开了一种图片聚类方法,包括:分别对多张待聚类图片进行特征提取,得到多个第一特征向量;对所述多个第一特征向量进行聚类,得到至少一个第一聚类簇;确定所述至少一个第一聚类簇中每一个第一聚类簇的中心特征向量;将每个第一聚类簇的中心特征向量与中心特征向量所属第一聚类簇中的其他第一特征向量分别进行融合,得到多个第二特征向量;对所述多个第二特征向量进行聚类,得到至少一个第二聚类簇;基于所述至少一个第二聚类簇进行图片聚类。通过上述图片聚类方法,优化了类中心特征的计算方式,优化图片特征的表达方式,提高了聚类的准确率。高了聚类的准确率。高了聚类的准确率。

【技术实现步骤摘要】
一种图片聚类方法、装置及存储介质


[0001]本专利技术属于图片聚类
,具体涉及一种图片聚类方法、装置及存储介质。

技术介绍

[0002]人脸聚类是一项将人脸识别等算法应用在安防领域的重要技术。具体的应用如对人脸进行分组,把相同的人脸分为同一档案,后续可以根据相关的人脸信息进行溯源调查。此外,人脸聚类可以在无注册信息的场景下,对采集到的人脸信息进行建档,后续可以用于分析用户画像、人员监控等。
[0003]目前人脸聚类技术主要分为两类方法,一类是在实时抓拍过程中,利用人脸质量分数抓拍多张待聚类图片,再用人脸识别归档聚类。另一类是先对人脸进行特征提取,然后对特征利用聚类算法进行聚类。由于业务需求对准确度更关注,因此现在多使用第二类图片聚类方法。
[0004]现有的技术方案,首先训练人脸特征提取模型,接着根据人脸特征计算两两图像的相似度,然后使用聚类算法,最后按照一定的规则、阈值进行类的合并和特殊情况处理。这类方法存在准确度低的缺点,且高度依赖于人脸特征提取模型的效果。其它的方法,也是首先训练人脸特征模型提取人脸特征,在进行聚类,不仅仅使用人脸特征信息,还结合了其它的信息,如技术使用两两图像属于同一类的置信度,基于两两图像的时空匹配度信息和特征相似度,确定其属于同一类别的联合概率。除了两两图像的相似度,还计算了图像与类中心特征的相似度。这类方法虽然准确度有了一定提升,但仍不能满足一些特定业务场景需求,特别是对算法效率要求高的场景。

技术实现思路

[0005]鉴于以上所述现有技术的缺点,本专利技术提供一种图片聚类方法、装置及存储介质,以优化类中心特征的计算方式。
[0006]为实现上述目的及其他相关目的,本专利技术提供一种图片聚类方法,该方法包括:
[0007]分别对多张待聚类图片进行特征提取,得到多个第一特征向量;
[0008]对所述多个第一特征向量进行聚类,得到至少一个第一聚类簇;
[0009]确定所述至少一个第一聚类簇中每一个第一聚类簇的中心特征向量;
[0010]将每个第一聚类簇的中心特征向量与中心特征向量所属第一聚类簇中的其他第一特征向量分别进行融合,得到多个第二特征向量;
[0011]对所述多个第二特征向量进行聚类,得到至少一个第二聚类簇;
[0012]基于所述至少一个第二聚类簇进行图片聚类。
[0013]可选地,确定所述至少一个第一聚类簇中每一个第一聚类簇的中心特征向量,包括:
[0014]在每个第一聚类簇中,确定第三特征向量,所述第三特征向量为第一聚类簇中拥有最多相似特征向量的特征向量;
[0015]计算第三特征向量与第一聚类簇中其他特征向量的第一相似度,将第一相似度大于设定相似度阈值的其中一个特征向量作为第四特征向量;
[0016]对所述第三特征向量与所述第四特征向量进行加权平均,得到第一个新的特征向量;
[0017]计算第一个新的特征向量与第一聚类簇中其他特征向量的第二相似度,将第二相似度大于设定相似度阈值的其中一个特征向量作为第五特征向量;
[0018]对所述第五特征向量与所述第一个新的特征向量进行加权平均,得到第二个新的特征向量;
[0019]重复上述得到新的特征向量的步骤,直到聚类簇类内的特征向量被遍历完或无满足相似度阈值条件的特征向量为止;
[0020]将最后得到的新的特征向量作为中心特征向量。
[0021]可选地,确定所述至少一个第一聚类簇中每一个第一聚类簇的中心特征向量,包括:
[0022]在每一个第一聚类簇中,确定第三特征向量,所述第三特征向量为第一聚类簇中拥有最多相似特征向量的特征向量;
[0023]计算第三特征向量与第一聚类簇中其他特征向量之间的距离,将距离小于设定距离阈值的其中一个特征向量作为第四特征向量;
[0024]对所述第三特征向量与所述第四特征向量进行加权平均,得到第一个新的特征向量;
[0025]计算第一个新的特征向量与第一聚类簇中其他特征向量之间的距离,将距离小于设定距离阈值的其中一个特征向量作为第五特征向量;
[0026]对所述第五特征向量与所述第一个新的特征向量进行加权平均,得到第二个新的特征向量;
[0027]重复上述得到新的特征向量的步骤,直到聚类簇类内的特征向量被遍历完或无满足距离阈值条件的特征向量为止;
[0028]将最后得到的新的特征向量作为中心特征向量。
[0029]可选地,利用KNN聚类算法对所述多个第一特征向量进行聚类。
[0030]可选地,在对所述多个第二特征向量进行聚类前,基于所述多个第二特征向量构建KNN图,利用infomap聚类算法对所述KNN图进行聚类。
[0031]可选地,所述对所述多个第一特征向量进行聚类,包括:
[0032]获取多个第一特征向量中任意两个第一特征向量之间的特征相似度;
[0033]基于所述任意两个第一特征向量之间的特征相似度构建KNN矩阵;
[0034]将特征相似度小于设定特征相似度阈值的特征相似度置为0,得到稀疏矩阵;
[0035]基于所述稀疏矩阵完成对所述多个第一特征向量的聚类。
[0036]可选地,该方法还包括:
[0037]确定出图片数量小于设定值的第二聚类簇;
[0038]对图片数量小于设定值的第二聚类簇中的图片进行重新聚类,使所述图片数量小于设定值的第二聚类簇中的图片属于所述第一聚类簇。
[0039]可选地,所述将中心特征向量与中心特征向量所属第一聚类簇中的其他第一特征
向量分别进行融合,包括:将中心特征向量与第一特征向量进行横向首尾顺次拼接。
[0040]为实现上述目的及其他相关目的,本专利技术提供一种图片聚类装置,该装置包括:
[0041]特征提取模块,用于分别对多张待聚类图片进行特征提取,得到多个第一特征向量;
[0042]第一聚类模块,用于对所述多个第一特征向量进行聚类,得到至少一个第一聚类簇;
[0043]中心特征向量确定模块,用于确定所述至少一个第一聚类簇中每一个第一聚类簇的中心特征向量;
[0044]特征融合模块,用于将每个第一聚类簇的中心特征向量与中心特征向量所属第一聚类簇中的其他第一特征向量分别进行融合,得到多个第二特征向量;
[0045]第二聚类模块,用于对所述多个第二特征向量进行聚类,得到至少一个第二聚类簇;
[0046]第三聚类模块,用于基于所述至少一个第二聚类簇进行图片聚类。
[0047]为实现上述目的及其他相关目的,本专利技术还提供一种存储介质,存储计算机程序,所述计算机程序被处理器运行时执行所述的方法。
[0048]如上所述,本专利技术的一种图片聚类方法、装置及存储介质,具有以下有益效果:
[0049]本专利技术的一种图片聚类方法,包括:分别对多张待聚类图片进行特征提取,得到多个第一特征向量;对所述多个第一特征向量进行聚类,得到至少一个第一聚类簇;确本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图片聚类方法,其特征在于,该方法包括:分别对多张待聚类图片进行特征提取,得到多个第一特征向量;对所述多个第一特征向量进行聚类,得到至少一个第一聚类簇;确定所述至少一个第一聚类簇中每一个第一聚类簇的中心特征向量;将每个第一聚类簇的中心特征向量与中心特征向量所属第一聚类簇中的其他第一特征向量分别进行融合,得到多个第二特征向量;对所述多个第二特征向量进行聚类,得到至少一个第二聚类簇;基于所述至少一个第二聚类簇进行图片聚类。2.根据权利要求1所述的图片聚类方法,其特征在于,确定所述至少一个第一聚类簇中每一个第一聚类簇的中心特征向量,包括:在每个第一聚类簇中,确定第三特征向量,所述第三特征向量为第一聚类簇中拥有最多相似特征向量的特征向量;计算第三特征向量与第一聚类簇中其他特征向量的第一相似度,将第一相似度大于设定相似度阈值的其中一个特征向量作为第四特征向量;对所述第三特征向量与所述第四特征向量进行加权平均,得到第一个新的特征向量;计算第一个新的特征向量与第一聚类簇中其他特征向量的第二相似度,将第二相似度大于设定相似度阈值的其中一个特征向量作为第五特征向量;对所述第五特征向量与所述第一个新的特征向量进行加权平均,得到第二个新的特征向量;重复上述得到新的特征向量的步骤,直到聚类簇类内的特征向量被遍历完或无满足相似度阈值条件的特征向量为止;将最后得到的新的特征向量作为中心特征向量。3.根据权利要求1所述的图片聚类方法,其特征在于,确定所述至少一个第一聚类簇中每一个第一聚类簇的中心特征向量,包括:在每一个第一聚类簇中,确定第三特征向量,所述第三特征向量为第一聚类簇中拥有最多相似特征向量的特征向量;计算第三特征向量与第一聚类簇中其他特征向量之间的距离,将距离小于设定距离阈值的其中一个特征向量作为第四特征向量;对所述第三特征向量与所述第四特征向量进行加权平均,得到第一个新的特征向量;计算第一个新的特征向量与第一聚类簇中其他特征向量之间的距离,将距离小于设定距离阈值的其中一个特征向量作为第五特征向量;对所述第五特征向量与所述第一个新的特征向量进行加权平均,得到第二个新的特征向量;重复上述得到新的特征向量的...

【专利技术属性】
技术研发人员:刘畅段钧宝
申请(专利权)人:重庆紫光华山智安科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1