一种基于关联图的离线人脸聚类方法技术

技术编号：27307663 阅读：16 留言：0更新日期：2021-02-10 09:24

本发明专利技术公开了一种基于关联图的离线人脸聚类方法，包括：获取待聚类人脸图片；利用已训练好的卷积神经网络模型对待聚类人脸图片提取人脸特征；采用KNN算法对人脸特征构建K邻近相邻节点集合；自适应计算K邻近相邻节点集合的聚类阈值；基于相邻节点构建各节点关联图并进行迭代类别聚合；基于投票机制进行多标签清洗和节点重聚类。本发明专利技术通过提出的动态K邻近相邻节点集合构建以及分类标签的动态更新技术可以在大幅提升计算效率的同时将计算资源的使用降到最低。本发明专利技术可在高度并行化基础上，实现60分钟内完成针对百万量级的人脸图像的聚类，并且无遗漏地赋予每个人脸图像唯一类别的标签。别的标签。别的标签。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于关联图的离线人脸聚类方法

[0001]本专利技术涉及计算机视觉、图像处理领域，特别是一种基于关联图的离线人脸聚类方法。

技术介绍

[0002]随着城市信息化的不断推进，海量的图像被存储到数据库中。但是对于已存储图像信息的处理是目前具有极大挑战的难题。其中数据自动标签化是解决这一难题的关键技术，数据的自动标签化技术可以使计算机代替人力自动对数据进行归纳整理并赋予其应有的数据信息标签。自动标签化方法中聚类算法为其核心算法，目前聚类算法常见的应用领域有人脸识别、车辆检索、行人重识别等。目前公共安全领域通常会使用聚类算法为不同的目标构建档案库，如基于人脸、行人图像的一人一档，基于车辆信息的一车一档等等。
[0003]目前常用的聚类算法如K-means(K均值)聚类，谱聚类，层次聚类等方法，对未标记的人脸图像进行分组。但是，对于大规模数据聚类，上述方法存在着严重的缺陷，如K均值聚类算法需要指定聚类中心个数，而在现实世界获取的数据是无法精确预测中心个数的。而且对于超大规模数据的处理上，上述算法需要庞大的计算资源和海量的存储空间。

技术实现思路

[0004]本专利技术的目的是要解决目前技术中无法准确、高效、自动化对大规模数据聚类、标签化方法的问题，提供一种基于关联图的离线人脸聚类方法。
[0005]为达到上述目的，本专利技术是按照以下技术方案实施的：
[0006]一种基于关联图的离线人脸聚类方法，包括如下步骤：
[0007]S1、获取待聚类人脸图片；
[0008]S2...

【技术保护点】

【技术特征摘要】
1.一种基于关联图的离线人脸聚类方法，其特征在于，包括如下步骤：S1、获取待聚类人脸图片；S2、利用已训练好的卷积神经网络模型对待聚类人脸图片提取人脸特征；S3、采用KNN算法对人脸特征构建K邻近相邻节点集合；S4、自适应计算K邻近相邻节点集合的聚类阈值；S5、基于相邻节点构建各节点关联图并进行迭代类别聚合；S6、基于投票机制进行多标签清洗和节点重聚类。2.根据权利要求1所述的基于关联图的离线人脸聚类方法，其特征在于，所述S2具体包括：S21、截取待聚类人脸图片中的人脸图像；S22、对人脸进行人脸关键点检测，并进行人脸矫正；S23、将矫正后的人脸图像输入到已训练好的卷积神经网络模型，输出多维的人脸特征向量。3.根据权利要求2所述的基于关联图的离线人脸聚类方法，其特征在于，所述S3具体包括：S31、将每一幅人脸图像由卷积神经网络模型输出的人脸特征视作一个节点，计算当前样本节点与其他节点的人脸特征相似度；S32、将计算的人脸特征相似度进行排序，并按预设相似度阈值选取当前节点的相邻节点，然后构建K邻近相邻节点集合。4.根据权利要求1所述的基于关联图的离线人脸聚类方法，其特征在于，所述S4具体包括：S41、根据K邻近节点集合的数据分布，计算该数据集下每个类别的平均预计节点个数size
avg-count
作为后续类别聚合中节点上限数量，然后增加一定的余量cmax
size
＝α
·
size
avg-count
；S42、首先确定阈值分布中心的位置，作为自适应阈值的基准参考，先对阈值进行量化，然后计算量化阈值统计直方图，并以频次最高的阈值为中心，以r为半径，计算出整体的基准阈值标准；S...

【专利技术属性】
技术研发人员：张振斌，陈杰，
申请(专利权)人：博云视觉北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人