人脸识别训练方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:28129791 阅读:21 留言:0更新日期:2021-04-19 11:50
本申请实施例属于人工智能领域,涉及一种人脸识别训练方法,包括统计训练数据集中每个用户的人脸图像数量,获取人脸图像数量排序在前的N个用户,将N个用户对应的人脸图像传输到预设的特征提取模型中进行特征提取,得到图像特征数据,将图像特征数据进行特征聚类得到不同的特征类,根据特征类筛选出两两最相似的用户组成四元组,将所有的四元组输入特征扩充学习模型中进行训练,使用训练好的特征扩充学习模型对目标用户进行特征映射扩充。本申请还提供一种人脸识别训练装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,图像特征数据可存储于区块链中。本申请可以达到特征空间上支撑面积增加的效果,进而可以提高人脸识别的准确性。的准确性。的准确性。

【技术实现步骤摘要】
人脸识别训练方法、装置、计算机设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及人脸识别训练方法、装置、计算机设备及存储介质。

技术介绍

[0002]目前,人脸识别技术已在视频监控、证件验证、刑侦破案等社会生活的诸多方面发挥着巨大作用。但是,当前人脸识别算法的数据集都存在长尾问题,尤其在使用自采集数据进行训练的过程中,长尾问题的现象更加严重。
[0003]一般在自采集的数据中,平均每个ID中有效图片的数量只有20到30张。在训练过程中如果使用这些数据,则该ID的类特征空间就会很小,也就是说该分布并不能完全代表该类的特征空间分布,因此在对该部分数据进行特征提取的时候,特征中心不准确,造成特征提取的准确率偏低。
[0004]而当前解决该问题的方法之一是人工增加数据,但是该方式效率太低并且成本太高。其他一些方法如使用GAN进行数据扩增,但是该类方法很容易学习到不属于人脸识别需要的一些特征,从而在训练数据上引入了噪音,降低人脸识别精确度。

技术实现思路

[0005]本申请实施例的目的在于提出一种人脸识别训练方法、装置、计算机设备及存储介质,以解决相关技术中训练数据存在长尾问题造成人脸识别不准确的问题。
[0006]为了解决上述技术问题,本申请实施例提供一种人脸识别训练方法,采用了如下所述的技术方案:
[0007]统计训练数据集中每个用户的人脸图像数量,并按照所述人脸图像数量大小进行排序;
[0008]获取排序在前的N个用户,并将N个用户对应的人脸图像作为样本数据传输到预设的特征提取模型中进行特征提取,得到图像特征数据;
[0009]将所述图像特征数据进行特征聚类得到不同的特征类;
[0010]根据所述特征类筛选出两两最相似的用户组成四元组;
[0011]将所有的四元组输入特征扩充学习模型中进行训练;及
[0012]使用训练好的特征扩充学习模型对目标用户进行特征映射扩充。
[0013]进一步的,所述将所述图像特征数据进行特征聚类得到不同的特征类的步骤包括:
[0014]确定聚类的个数K,从所述图像特征数据中选取K个图像特征作为聚类中心;
[0015]评估所述K个图像特征之外的图像特征与每一个聚类中心之间的第一距离,根据所述第一距离将图像特征进行归类,得到初始归类结果;
[0016]根据所述初始归类结果计算每类中所有图像特征的平均位置,将所述平均位置确定为新的聚类中心,;
[0017]计算新的聚类中心之外的图像特征与每一个新的聚类中心之间的第二距离,直至聚类中心收敛,确定出K个最终的特征类。
[0018]进一步的,所述根据所述特征类筛选出两两最相似的用户组成四元组的步骤包括:
[0019]确定每个用户最接近的特征类;
[0020]根据所述用户最接近的特征类的类中心计算两两用户之间的类中心距离,并筛选出所述类中心距离相差最小的两个用户组成四元组。
[0021]进一步的,所述确定每个用户最接近的特征类的步骤包括:
[0022]获取每个用户在每个特征类内的第一图像特征数量;
[0023]将包含有所述第一图像特征数量最多的特征类确定为所述用户最接近的特征类。
[0024]进一步的,在所述将包含有所述第一图像特征数量最多的特征类确定为所述用户最接近的特征类的步骤之后还包括:
[0025]当存在两个或者两个以上的用户最接近的特征类是同一个类别,则分别计算每个用户中所有图像特征的平均位置;
[0026]计算所述平均位置与K个最终聚类中心的距离;
[0027]根据距离确定所述用户最接近的特征类。
[0028]进一步的,在所述使用训练好的特征扩充学习模型对目标用户进行特征映射扩充的步骤之后还包括:
[0029]使用扩充后的图像特征数据对分类器进行训练,根据训练结果迭代所述分类器的权重,并固定所述分类器的权重;
[0030]使用所述扩充后的图像特征数据对预设的特征提取模型进行重新训练。
[0031]进一步的,所述使用扩充后的图像特征数据对分类器进行训练的步骤包括:
[0032]对扩充后的图像特征进行reshape,使其与原始特征具有相同的维度;
[0033]将reshape后的特征作为分类器训练过程的输入,对分类器进行训练。
[0034]为了解决上述技术问题,本申请实施例还提供一种人脸识别训练装置,采用了如下所述的技术方案:
[0035]统计模块,用于统计训练数据集中每个用户的人脸图像数量,并按照所述人脸图像数量大小进行排序;
[0036]特征提取模块,用于获取排序在前的N个用户,并将N个用户对应的人脸图像作为样本数据传输到预设的特征提取模型中进行特征提取,得到图像特征数据;
[0037]聚类模块,用于将所述图像特征数据进行特征聚类得到不同的特征类;
[0038]筛选模块,用于根据所述特征类筛选出两两最相似的用户组成四元组;
[0039]训练模块,用于将所有的四元组输入特征扩充学习模型中进行训练;及
[0040]扩充模块,用于使用训练好的特征扩充学习模型对目标用户进行特征映射扩充。
[0041]为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
[0042]该计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上所述的人脸识别训练方法的步骤。
[0043]为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了
如下所述的技术方案:
[0044]所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的人脸识别训练方法的步骤。
[0045]与现有技术相比,本申请实施例主要有以下有益效果:
[0046]本申请通过统计训练数据集中每个用户的人脸图像数量,并按照所述人脸图像数量大小进排序,获取排序在前的N个用户,并将N个用户对应的人脸图像作为样本数据传输到预设的特征提取模型中进行特征提取,得到图像特征数据,将图像特征数据进行特征聚类得到不同的特征类,根据特征类筛选出两两最相似的用户组成四元组,将所有的四元组输入特征扩充学习模型中进行训练,最后使用训练好的特征扩充学习模型对目标用户进行特征映射扩充;本申请通过将提取出来的图像特征数据进行聚类得到不同的特征类,根据特征类筛选出两个最相似的用户组成四元组进行训练,用于对样本数目不足的目标用户进行特征扩充,从而达到特征空间上支撑面积增加的效果,进而可以提高人脸识别的准确性。
附图说明
[0047]为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人脸识别训练方法,其特征在于,包括下述步骤:统计训练数据集中每个用户的人脸图像数量,并按照所述人脸图像数量大小进行排序;获取排序在前的N个用户,并将N个用户对应的人脸图像作为样本数据传输到预设的特征提取模型中进行特征提取,得到图像特征数据;将所述图像特征数据进行特征聚类得到不同的特征类;根据所述特征类筛选出两两最相似的用户组成四元组;将所有的四元组输入特征扩充学习模型中进行训练;及使用训练好的特征扩充学习模型对目标用户进行特征映射扩充。2.根据权利要求1所述的人脸识别训练方法,其特征在于,所述将所述图像特征数据进行特征聚类得到不同的特征类的步骤包括:确定聚类的个数K,从所述图像特征数据中选取K个图像特征作为初始聚类中心;评估所述K个图像特征之外的图像特征与每一个聚类中心之间的第一距离,根据所述第一距离将图像特征进行归类,得到初始归类结果;根据所述初始归类结果计算每类中所有图像特征的平均位置,将所述平均位置确定为新的聚类中心;计算新的聚类中心之外的图像特征与每一个新的聚类中心之间的第二距离,直至聚类中心收敛,确定出K个最终的特征类。3.根据权利要求1所述的人脸识别训练方法,其特征在于,所述根据所述特征类筛选出两两最相似的用户组成四元组的步骤包括:确定每个用户最接近的特征类;根据所述用户最接近的特征类的类中心计算两两用户之间的类中心距离,并筛选出所述类中心距离相差最小的两个用户组成四元组。4.根据权利要求3所述的人脸识别训练方法,其特征在于,所述确定每个用户最接近的特征类的步骤包括:获取每个用户在每个特征类内的第一图像特征数量;将包含有所述第一图像特征数量最多的特征类确定为所述用户最接近的特征类。5.根据权利要求4所述的人脸识别训练方法,其特征在于,在所述将包含有所述第一图像特征数量最多的特征类确定为所述用户最接近的特征类的步骤之后还包括:当存在两个或者两个以上的...

【专利技术属性】
技术研发人员:刘钊
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1