一种人脸图像的聚类方法、装置及介质制造方法及图纸

技术编号:24331757 阅读:19 留言:0更新日期:2020-05-29 19:56
一种人脸图像的聚类方法、装置及介质,包括获取M个待聚类的人脸图像,根据每一个待聚类的人脸图像获得对应高维度的人脸特征向量,对每一维度数据进行有损压缩,获得压缩后的人脸特征向量,根据压缩后的人脸特征向量及预设N种不同的近似最近邻算法,获得对应的最近邻结果,根据预设阈值对最近邻结果进行筛选,获取得到最终的最近邻结果,根据最终的最近邻结果对压缩后的人脸特征向量进行聚类,以完成对M个待聚类的人脸图像的聚类。在保证人脸特征向量维度不变的情况下,通过对人脸特征向量进行有损压缩,可显著降低人脸特征向量的内存空间占用,并综合多种不同的近似最近邻算法的计算结果,可有效提高人脸聚类的效果。

A clustering method, device and medium of face image

【技术实现步骤摘要】
一种人脸图像的聚类方法、装置及介质
本专利技术涉及信息处理
,具体涉及一种人脸图像的聚类方法、装置及介质。
技术介绍
视频监控已经随处可见,如何利用海量的抓拍照片或视频流来进行挖掘、分析成为行业的重点关注的课题。人脸聚类技术是一种将相同的人脸聚为一类,给其赋予一个虚拟ID的过程。人脸聚类不同于普通物体的聚类,不同人脸之间提取的特征差异很小,差异越小,将不同的人脸进行区分就越难,如何提升聚类效果成为人脸聚类领域比较关注的问题。当前人脸特征一般是采用深度学习中的卷积神经网络来提取,提取出的人脸特征是一个高维的特征向量,特征向量的维度越高,其占用内存空间就越多,计算时就需要更大的内存。在实际应用场景中,通常需要对海量的人脸图片进行聚类,当内存无法满足当前计算需求时,通常通过以下两种方式来解决:1)扩容,增加内存,或增加计算节点,这种方式通过增加硬件资源来实现对海量人脸图片的聚类,成本较高;2)对高维特征向量进行PCA降维,降低特征向量的维度,减少内存占用,如将512维的特征向量降至256维,维度降低会损失特征向量的信息,用降低维度的特征向量进行人脸聚类时,聚类效果会变差。
技术实现思路
本专利技术的目的在于解决上述人脸特征向量维度较高时,对海量人脸图片进行聚类内存资源占用大的问题,提出了一种人脸图像的聚类方法,在保证人脸特征向量维度不变的情况下,降低人脸特征向量的内存空间占用。根据第一方面,本专利技术实施例提供一种人脸图像的聚类方法,包括:获取M个待聚类的人脸图像,其中,M为大于1的整数;根据每一个待聚类的人脸图像获得对应高维度的人脸特征向量;对所述高维度的人脸特征向量的每一维度数据进行有损压缩,获得压缩后的人脸特征向量;根据所述压缩后的人脸特征向量及预设的N种不同的近似最近邻算法,获得对应的最近邻结果,其中,N为大于1的整数;根据预设阈值对所述最近邻结果进行筛选,得到最终的最近邻结果;根据所述最终的最近邻结果对所述压缩后的人脸特征向量进行聚类,以完成对所述M个待聚类的人脸图像的聚类。在其中一种可能实现方式中,所述对所述高维度的人脸特征向量的每一维度数据进行有损压缩,获得压缩后的人脸特征向量包括:获取预设字节值和预设放大倍数值,其中所述预设字节值为预先设置的压缩后每一维度数据所占字节大小的数值,其中,所述预设放大倍数值为预先设置的对每一维度数据进行放大的倍数值;将所述高维度的人脸特征向量的每一维度数据乘以所述预设放大倍数值,获得放大后的人脸特征向量;根据所述预设字节值对所述放大后的人脸特征向量的每一维度数据进行截取,使得被截取后的人脸特征向量的每一维度的数据所占字节大小为所述预设字节值,以得到压缩后的人脸特征向量。在其中一种可能实现方式中,所述获取预设字节值和预设放大倍数值包括:获取用户输入的预设字节值;获取所述高维度的人脸特征向量的每一维度数据的数据分布情况;根据每一维度数据的数据分布情况和所述预设字节值,得到预设放大倍数值。在其中一种可能实现方式中,当所述预设字节值为一个字节,且所述高维度的人脸特征向量的每一维度数据的数据分布情况为,其数据的值分布在-0.25到0.25之间时,得到的所述预设放大倍数值为512。在其中一种可能实现方式中,在所述对所述高维度的人脸特征向量的每一维度数据进行有损压缩,获得压缩后的人脸特征向量之前,还包括:检测当前已完成压缩的人脸特征向量的个数是否小于所述高维度的人脸特征向量的总个数;若当前已完成压缩的人脸特征向量的个数小于所述高维度的人脸特征向量的总个数,则检测未完成压缩的人脸特征向量的已压缩的维度是否小于所述高维度的人脸特征向量对应的维度;当未完成压缩的人脸特征向量的已压缩的维度小于所述高维度的人脸特征向量对应的维度时,获取该人脸特征向量对应的未压缩维度的数据,以用于进行有损压缩。在其中一种可能实现方式中,所述根据所述预设字节值对所述放大后的人脸特征向量的每一维度数据进行截取,得到压缩后的人脸特征向量包括:当放大后的人脸特征向量的数值大于-128且小于127时,将所述放大后的人脸特征向量取整后作为压缩后的人脸特征向量;当放大后的人脸特征向量的数值小于或等于-128时,将-128作为压缩后的人脸特征向量;当放大后的人脸特征向量的数值大于或等于127时,将127作为压缩后的人脸特征向量。在其中一种可能实现方式中,所述根据所述压缩后的人脸特征向量及预设的N种不同的近似最近邻算法,获得对应的最近邻结果包括:获取预设的N种不同的近似最近邻算法;将所述压缩后的人脸特征向量通过所述预设的N种不同的近似最近邻算法分别计算出对应的最近邻结果;获取各个不同的近似最近邻算法所计算得到的最近邻结果。在其中一种可能实现方式中,所述根据预设阈值对所述最近邻结果进行筛选,获取得到最终的最近邻结果包括:针对每一人脸特征向量,对其对应的所述最近邻结果进行求和统计,获得统计结果;根据所述预设阈值对统计结果进行筛选,获取与该人脸特征向量相似的人脸特征向量,其中,所述预设阈值为预设的与一人脸特征向量相似的其余人脸特征向量的个数;根据与每一人脸特征向量相似的其余人脸特征向量,获取得到最终的最近邻结果。根据第二方面,本专利技术实施例提供一种人脸图像的聚类装置,包括:图像获取模块,用于获取M个待聚类的人脸图像,其中,M为大于1的整数;向量获取模块,用于根据每一个待聚类的人脸图像获得对应高维度的人脸特征向量;压缩模块,用于对所述高维度的人脸特征向量的每一维度数据进行有损压缩,获得压缩后的人脸特征向量;结果获取模块,用于根据所述压缩后的人脸特征向量及预设的N种不同的近似最近邻算法,获得对应的最近邻结果,其中,N为大于1的整数;最终结果获取模块,用于根据预设阈值对所述最近邻结果进行筛选,得到最终的最近邻结果;聚类模块,用于根据所述最终的最近邻结果对所述压缩后的人脸特征向量进行聚类,以完成对所述M个待聚类的人脸图像的聚类。根据第三方面,本专利技术实施例提供一种产品,其特征在于包括:存储器,用于存储程序;处理器,用于通过执行所述存储器存储的程序以实现如上任一项所述的人脸图像的聚类方法。依据上述实施例的人脸图像的聚类方法、装置及介质,包括获取M个待聚类的人脸图像,然后根据每一个待聚类的人脸图像获得对应高维度的人脸特征向量,对所述高维度的人脸特征向量的每一维度数据进行有损压缩,获得压缩后的人脸特征向量,根据所述压缩后的人脸特征向量及预设N种不同的近似最近邻算法,获得对应的最近邻结果,根据预设阈值对所述最近邻结果进行筛选,得到最终的最近邻结果,根据所述最终的最近邻结果对所述压缩后的人脸特征向量进行聚类,以完成对所述M个待聚类的人脸图像的聚类。在保证人脸特征向量维度不变的情况下,通过对人脸特征向量进行有损压缩,可显著降低人脸特征向量本文档来自技高网...

【技术保护点】
1.一种人脸图像的聚类方法,其特征在于,包括:/n获取M个待聚类的人脸图像,其中,M为大于1的整数;/n根据每一个待聚类的人脸图像获得对应高维度的人脸特征向量;/n对所述高维度的人脸特征向量的每一维度数据进行有损压缩,获得压缩后的人脸特征向量;/n根据所述压缩后的人脸特征向量及预设的N种不同的近似最近邻算法,获得对应的最近邻结果,其中,N为大于1的整数;/n根据预设阈值对所述最近邻结果进行筛选,得到最终的最近邻结果;/n根据所述最终的最近邻结果对所述压缩后的人脸特征向量进行聚类,以完成对所述M个待聚类的人脸图像的聚类。/n

【技术特征摘要】
1.一种人脸图像的聚类方法,其特征在于,包括:
获取M个待聚类的人脸图像,其中,M为大于1的整数;
根据每一个待聚类的人脸图像获得对应高维度的人脸特征向量;
对所述高维度的人脸特征向量的每一维度数据进行有损压缩,获得压缩后的人脸特征向量;
根据所述压缩后的人脸特征向量及预设的N种不同的近似最近邻算法,获得对应的最近邻结果,其中,N为大于1的整数;
根据预设阈值对所述最近邻结果进行筛选,得到最终的最近邻结果;
根据所述最终的最近邻结果对所述压缩后的人脸特征向量进行聚类,以完成对所述M个待聚类的人脸图像的聚类。


2.如权利要求1所述的方法,其特征在于,所述对所述高维度的人脸特征向量的每一维度数据进行有损压缩,获得压缩后的人脸特征向量包括:
获取预设字节值和预设放大倍数值,其中所述预设字节值为预先设置的压缩后每一维度数据所占字节大小的数值,其中,所述预设放大倍数值为预先设置的对每一维度数据进行放大的倍数值;
将所述高维度的人脸特征向量的每一维度数据乘以所述预设放大倍数值,获得放大后的人脸特征向量;
根据所述预设字节值对所述放大后的人脸特征向量的每一维度数据进行截取,使得被截取后的人脸特征向量的每一维度的数据所占字节大小为所述预设字节值,以得到压缩后的人脸特征向量。


3.如权利要求2所述的方法,其特征在于,所述获取预设字节值和预设放大倍数值包括:
获取用户输入的预设字节值;
获取所述高维度的人脸特征向量的每一维度数据的数据分布情况;
根据每一维度数据的数据分布情况和所述预设字节值,得到预设放大倍数值。


4.如权利要求3所述的方法,其特征在于,当所述预设字节值为一个字节,且所述高维度的人脸特征向量的每一维度数据的数据分布情况为,其数据的值分布在-0.25到0.25之间时,得到的所述预设放大倍数值为512。


5.如权利要求1至4任一项所述的方法,其特征在于,在所述对所述高维度的人脸特征向量的每一维度数据进行有损压缩,获得压缩后的人脸特征向量之前,还包括:
检测当前已完成压缩的人脸特征向量的个数是否小于所述高维度的人脸特征向量的总个数;
若当前已完成压缩的人脸特征向量的个数小于所述高维度的人脸特征向量的总个数,则检测未完成压缩的人脸特征向量的已压缩的维度是否小于所述高维度的人脸特征向量对应的维度;
当未完成压缩的人脸特征向量的已压缩的维度小于所述高维度的人脸特征向量对应的维度时,获取该人脸特征向量对应的未压缩维...

【专利技术属性】
技术研发人员:陈婷朱金华蔡振伟
申请(专利权)人:深圳力维智联技术有限公司南京中兴力维软件有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1