一种人脸聚类样本数量的选择方法及系统技术方案

技术编号:25600390 阅读:18 留言:0更新日期:2020-09-11 23:57
本发明专利技术涉及人脸识别技术领域,公开了一种人脸聚类样本数量的选择方法,所述方法包括:构建一人脸测试集,以及构建多个人脸训练集,每一个人脸训练集的人脸图像数量不同;对所述多个人脸训练集进行聚类,获取对应的多个聚类中心;计算每一个聚类中心与所述人脸测试集中的每一张人脸图像的特征向量的余弦距离,获取每一个聚类中心对应的余弦距离的均值和均方根值;根据所述每一个聚类中心对应的余弦距离均值和均方根值,获取人脸聚类样本的数量范围。相应的,本发明专利技术还公开了一种人脸聚类样本数量的选择系统。本发明专利技术提供了人脸聚类样本数量的选择方法,并能够保证良好的聚类效果。

【技术实现步骤摘要】
一种人脸聚类样本数量的选择方法及系统
本专利技术涉及人脸识别
,尤其涉及一种人脸聚类样本数量的选择方法及系统。
技术介绍
人脸识别技术是基于人的脸部特征信息进行身份识别的一种生物识别技术,用摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测的人脸进行识别的一系列相关技术。在人脸识别的产品中,需要添加多张人脸图片去注册人脸模型。注册的人脸模型一般是特征向量,会出现一个人对应多个人脸特征向量的问题,因此需要人脸特征向量进行聚类,使一个人对应唯一的特征向量。人脸聚类算法的目的是将同一人的多张照片提取到的特征向量通过聚类,找到这些特征向量的聚类中心,使聚类中心到各自图像的距离的平方和最小。公布号为CN108875778A的专利申请公布了一种人脸聚类方法,所述方法包括:基于待聚类图像的数量确定聚类方式,所述聚类方式描述每次从所述待聚类图像中获取多少张图像进行一次人脸聚类;以及基于所述确定的聚类方式每次从所述待聚类图像中获取相应数量的图像进行人脸聚类,直到所述待聚类图像全部完成。一般来说,聚类算法在图像比较多的情况下,聚类效果比较好。但是在人脸注册时用户只提供少量照片图像做聚类。上述专利申请提供了人脸聚类的技术方案,并没有提供人脸聚类样本数量的选择方法。因此,如何选择和评估人脸聚类样本数量,并保证良好的聚类效果,成为有必要解决的技术问题。
技术实现思路
本专利技术的目的在于提供一种人脸聚类样本数量的选择方法及系统,提供了人脸聚类样本数量的选择方法,并能够保证良好的聚类效果。为实现上述目的,本专利技术提供了一种人脸聚类样本数量的选择方法,所述方法包括:构建一人脸测试集,以及构建多个人脸训练集,每一个人脸训练集的人脸图像数量不同;对所述多个人脸训练集进行聚类,获取对应的多个聚类中心;计算每一个聚类中心与所述人脸测试集中的每一张人脸图像的特征向量的余弦距离,获取每一个聚类中心对应的余弦距离的均值和均方根值;根据所述每一个聚类中心对应的余弦距离均值和均方根值,获取人脸聚类样本的数量范围。基于该技术方案,提出了以聚类中心与测试集图像的余弦距离的平均值与均方根值作为评价人脸聚类样本数量的指标的技术方案。优选的,所述步骤S1包括:构建一具有多个人的人脸图像原始人脸图像集,对所述原始人脸图像集中的所有人脸图像进行人脸检测和裁剪;从所述原始人脸图像集中选择一预设数量的同一个人的人脸图像,所述选择的人脸图像构成所述人脸测试集。优选的,所述步骤S1包括:构建第一人脸训练集,所述第一人脸训练集的人脸图像数量为N1张;构建第二人脸训练集,所述第二人脸训练集的人脸图像数量为N2张;构建第三人脸训练集,所述第三人脸训练集的人脸图像数量为N3张;构建第四人脸训练集,所述第四人脸训练集的人脸图像数量为N4张;其中,N1>N2>N3>N4,N1>10,N2≤10,N4≥3。优选的,所述步骤S2包括:根据卷积神经网络模型,对所述第一人脸训练集中的每一张人脸图像进行卷积和特征提取,生成所述第一人脸训练集对应的第一特征向量组,并对所述第一特征向量组进行K均值聚类,得到所述第一人脸训练集对应的第一聚类中心;根据卷积神经网络模型,对所述第二人脸训练集中的每一张人脸图像进行卷积和特征提取,生成所述第二人脸训练集对应的第二特征向量组,并对所述第二特征向量组进行K均值聚类,得到所述第二人脸训练集对应的第二聚类中心;根据卷积神经网络模型,对所述第三人脸训练集中的每一张人脸图像进行卷积和特征提取,生成所述第三人脸训练集对应的第三特征向量组,并对所述第三特征向量组进行K均值聚类,得到所述第三人脸训练集对应的第三聚类中心;根据卷积神经网络模型,对所述第四人脸训练集中的每一张人脸图像进行卷积和特征提取,生成所述第四人脸训练集对应的第四特征向量组,并对所述第四特征向量组进行K均值聚类,得到所述第四人脸训练集对应的第四聚类中心。优选的,所述步骤S3包括:所述余弦距离的均值的计算公式为式1:其中,mean为余弦距离的均值,n为所述人脸测试集中的人脸图像数量,di为聚类中心与所述人脸测试集中的第i张人脸图像的特征向量的余弦距离。优选的,所述步骤S3还包括:所述余弦距离的均方根值的计算公式为式2:其中,var为余弦距离的均方根值,n为所述人脸测试集中的人脸图像数量,di为聚类中心与所述人脸测试集中的第i张人脸图像的特征向量的余弦距离。优选的,所述步骤S3还包括:计算所述第一聚类中心与所述人脸测试集中的每一张人脸图像的特征向量的余弦距离,并根据所述式1和式2,获取所述第一聚类中心对应的余弦距离的均值和均方根值;计算所述第二聚类中心与所述人脸测试集中的每一张人脸图像的特征向量的余弦距离,并根据所述式1和式2,获取所述第二聚类中心对应的余弦距离的均值和均方根值;计算所述第三聚类中心与所述人脸测试集中的每一张人脸图像的特征向量的余弦距离,并根据所述式1和式2,获取所述第三聚类中心对应的余弦距离的均值和均方根值;计算所述第四聚类中心与所述人脸测试集中的每一张人脸图像的特征向量的余弦距离,并根据所述式1和式2,获取所述第四聚类中心对应的余弦距离的均值和均方根值。优选的,所述步骤S3还包括:分别计算所述第四人脸训练集中的每一张人脸图像的特征向量与所述人脸测试集中的每一张人脸图像的特征向量的余弦距离,并根据所述式1和式2,获取所述第四人脸训练集中的每一张人脸图像对应的余弦距离的均值和均方根值。优选的,所述步骤S4包括:所述人脸聚类样本的数量范围是[3,10]。根据该技术方案,提供了人脸聚类样本的数量范围,并能够取得一个良好的聚类效果,指导用户在人脸注册时所需要提供的人脸照片的样本数量。为实现上述目的,本专利技术提供了一种人脸聚类样本数量的选择系统,所述系统包括:训练集模块,用于构建一人脸测试集,以及构建多个人脸训练集,每一个人脸训练集的人脸图像数量不同;聚类模块,用于对所述多个人脸训练集进行聚类,获取对应的多个聚类中心;计算模块,用于计算每一个聚类中心与所述人脸测试集中的每一张人脸图像的特征向量的余弦距离,获取每一聚类中心对应的余弦距离的均值和均方根值;评估模块,用于根据所述每一个聚类中心对应的余弦距离均值和均方根值,获取人脸聚类样本的数量范围。基于该技术方案,提出了以聚类中心与测试集图像的余弦距离的平均值与均方根值作为评价人脸聚类样本数量的指标的技术方案。与现有技术相比,本专利技术一种人脸聚类样本数量的选择方法及系统所带来的有益效果为:提出了以聚类中心与测试集图像的余弦距离的平均值与均方根值作为评价人脸聚类样本数量的指标的技术方案,提供了人脸聚类样本的数量范围,并能够取得一个良好的聚类效果,指导用户在人脸注册时所需要提供的人脸照片的样本数量;满足了人脸注册时用户提供少量图像做人脸聚类的场景,实用性很强,提高了用户的体验效果。附图说明图1为根据本专利技术的一个实施例中人脸聚类样本数量的选择方法的流程示意图。图2为根据本专利技术的一个实施本文档来自技高网...

【技术保护点】
1.一种人脸聚类样本数量的选择方法,其特征在于,所述方法包括:/nS1、构建一人脸测试集,以及构建多个人脸训练集,每一个人脸训练集的人脸图像数量不同;/nS2、对所述多个人脸训练集进行聚类,获取对应的多个聚类中心;/nS3、计算每一个聚类中心与所述人脸测试集中的每一张人脸图像的特征向量的余弦距离,获取每一个聚类中心对应的余弦距离的均值和均方根值;/nS4、根据所述每一个聚类中心对应的余弦距离均值和均方根值,获取人脸聚类样本的数量范围。/n

【技术特征摘要】
1.一种人脸聚类样本数量的选择方法,其特征在于,所述方法包括:
S1、构建一人脸测试集,以及构建多个人脸训练集,每一个人脸训练集的人脸图像数量不同;
S2、对所述多个人脸训练集进行聚类,获取对应的多个聚类中心;
S3、计算每一个聚类中心与所述人脸测试集中的每一张人脸图像的特征向量的余弦距离,获取每一个聚类中心对应的余弦距离的均值和均方根值;
S4、根据所述每一个聚类中心对应的余弦距离均值和均方根值,获取人脸聚类样本的数量范围。


2.如权利要求1所述的人脸聚类样本数量的选择方法,其特征在于,所述步骤S1包括:
构建一具有多个人的人脸图像的原始人脸图像集,对所述原始人脸图像集中的所有人脸图像进行人脸检测和裁剪;
从所述原始人脸图像集中选择一预设数量的同一个人的人脸图像,所述选择的人脸图像构成所述人脸测试集。


3.如权利要求1所述的人脸聚类样本数量的选择方法,其特征在于,所述步骤S1还包括:
构建第一人脸训练集,所述第一人脸训练集的人脸图像数量为N1张;
构建第二人脸训练集,所述第二人脸训练集的人脸图像数量为N2张;
构建第三人脸训练集,所述第三人脸训练集的人脸图像数量为N3张;
构建第四人脸训练集,所述第四人脸训练集的人脸图像数量为N4张;
其中,N1>N2>N3>N4,N1>10,N2≤10,N4≥3。


4.如权利要求3所述的人脸聚类样本数量的选择方法,其特征在于,所述步骤S2包括:
根据卷积神经网络模型,对所述第一人脸训练集中的每一张人脸图像进行卷积和特征提取,生成所述第一人脸训练集对应的第一特征向量组,并对所述第一特征向量组进行K均值聚类,得到所述第一人脸训练集对应的第一聚类中心;
根据卷积神经网络模型,对所述第二人脸训练集中的每一张人脸图像进行卷积和特征提取,生成所述第二人脸训练集对应的第二特征向量组,并对所述第二特征向量组进行K均值聚类,得到所述第二人脸训练集对应的第二聚类中心;
根据卷积神经网络模型,对所述第三人脸训练集中的每一张人脸图像进行卷积和特征提取,生成所述第三人脸训练集对应的第三特征向量组,并对所述第三特征向量组进行K均值聚类,得到所述第三人脸训练集对应的第三聚类中心;
根据卷积神经网络模型,对所述第四人脸训练集中的每一张人脸图像进行卷积和特征提取,生成所述第四人脸训练集对应的第四特征向量组,并对所述第四特征向量组进行K均值聚类,得到所述第四人脸训练集对应的第四聚类中心。


5.如权利要求4所述的人脸聚类样本数量的选择方法,其特...

【专利技术属性】
技术研发人员:薛圆圆
申请(专利权)人:上海铼锶信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1