人脸识别训练方法、装置、计算机设备及存储介质制造方法及图纸

技术编号：28129791 阅读：21 留言：0更新日期：2021-04-19 11:50

本申请实施例属于人工智能领域，涉及一种人脸识别训练方法，包括统计训练数据集中每个用户的人脸图像数量，获取人脸图像数量排序在前的N个用户，将N个用户对应的人脸图像传输到预设的特征提取模型中进行特征提取，得到图像特征数据，将图像特征数据进行特征聚类得到不同的特征类，根据特征类筛选出两两最相似的用户组成四元组，将所有的四元组输入特征扩充学习模型中进行训练，使用训练好的特征扩充学习模型对目标用户进行特征映射扩充。本申请还提供一种人脸识别训练装置、计算机设备及存储介质。此外，本申请还涉及区块链技术，图像特征数据可存储于区块链中。本申请可以达到特征空间上支撑面积增加的效果，进而可以提高人脸识别的准确性。的准确性。的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
人脸识别训练方法、装置、计算机设备及存储介质

[0001]本申请涉及人工智能
，尤其涉及人脸识别训练方法、装置、计算机设备及存储介质。

技术介绍

[0002]目前，人脸识别技术已在视频监控、证件验证、刑侦破案等社会生活的诸多方面发挥着巨大作用。但是，当前人脸识别算法的数据集都存在长尾问题，尤其在使用自采集数据进行训练的过程中，长尾问题的现象更加严重。
[0003]一般在自采集的数据中，平均每个ID中有效图片的数量只有20到30张。在训练过程中如果使用这些数据，则该ID的类特征空间就会很小，也就是说该分布并不能完全代表该类的特征空间分布，因此在对该部分数据进行特征提取的时候，特征中心不准确，造成特征提取的准确率偏低。
[0004]而当前解决该问题的方法之一是人工增加数据，但是该方式效率太低并且成本太高。其他一些方法如使用GAN进行数据扩增，但是该类方法很容易学习到不属于人脸识别需要的一些特征，从而在训练数据上引入了噪音，降低人脸识别精确度。

技术实现思路

[0005]本申请实施例的目的在于提出一种人脸识别训练方法、装置、计算机设备及存储介质，以解决相关技术中训练数据存在长尾问题造成人脸识别不准确的问题。
[0006]为了解决上述技术问题，本申请实施例提供一种人脸识别训练方法，采用了如下所述的技术方案：
[0007]统计训练数据集中每个用户的人脸图像数量，并按照所述人脸图像数量大小进行排序；
[0008]获取排序在前的N个用户，并将N个用户对应的人脸图像作为样...

【技术保护点】

【技术特征摘要】
1.一种人脸识别训练方法，其特征在于，包括下述步骤：统计训练数据集中每个用户的人脸图像数量，并按照所述人脸图像数量大小进行排序；获取排序在前的N个用户，并将N个用户对应的人脸图像作为样本数据传输到预设的特征提取模型中进行特征提取，得到图像特征数据；将所述图像特征数据进行特征聚类得到不同的特征类；根据所述特征类筛选出两两最相似的用户组成四元组；将所有的四元组输入特征扩充学习模型中进行训练；及使用训练好的特征扩充学习模型对目标用户进行特征映射扩充。2.根据权利要求1所述的人脸识别训练方法，其特征在于，所述将所述图像特征数据进行特征聚类得到不同的特征类的步骤包括：确定聚类的个数K，从所述图像特征数据中选取K个图像特征作为初始聚类中心；评估所述K个图像特征之外的图像特征与每一个聚类中心之间的第一距离，根据所述第一距离将图像特征进行归类，得到初始归类结果；根据所述初始归类结果计算每类中所有图像特征的平均位置，将所述平均位置确定为新的聚类中心；计算新的聚类中心之外的图像特征与每一个新的聚类中心之间的第二距离，直至聚类中心收敛，确定出K个最终的特征类。3.根据权利要求1所述的人脸识别训练方法，其特征在于，所述根据所述特征类筛选出两两最相似的用户组成四元组的步骤包括：确定每个用户最接近的特征类；根据所述用户最接近的特征类的类中心计算两两用户之间的类中心距离，并筛选出所述类中心距离相差最小的两个用户组成四元组。4.根据权利要求3所述的人脸识别训练方法，其特征在于，所述确定每个用户最接近的特征类的步骤包括：获取每个用户在每个特征类内的第一图像特征数量；将包含有所述第一图像特征数量最多的特征类确定为所述用户最接近的特征类。5.根据权利要求4所述的人脸识别训练方法，其特征在于，在所述将包含有所述第一图像特征数量最多的特征类确定为所述用户最接近的特征类的步骤之后还包括：当存在两个或者两个以上的...

【专利技术属性】
技术研发人员：刘钊，
申请(专利权)人：中国平安人寿保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人