人脸识别模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33030454 阅读:9 留言:0更新日期:2022-04-15 09:06
本发明专利技术实施例提供了一种人脸识别模型的训练方法、装置、电子设备及存储介质,方法包括:获取源域人脸特征以及初始化识别模型;获取目标域的目标人脸图像样本;基于目标人脸图像样本以及源域人脸特征,调整初始化识别模型的部分模型参数,直到初始化识别模型收敛,得到针对源域和目标域的人脸识别模型。初始化模型在使用源域的全量人脸图像样本训练后,保存部分源域人脸特征,并固定初始化模型部分参数。进而,使用目标域的目标人脸图像样本和源域人脸特征对该初始化模型进行进一步训练后,得到针对源域和目标域的人脸识别模型。既保持了对源域全量人脸图像的识别能力,又可以准确识别目标域的目标人脸图像,提高了人脸识别模型的识别能力和精度。型的识别能力和精度。型的识别能力和精度。

【技术实现步骤摘要】
人脸识别模型的训练方法、装置、电子设备及存储介质


[0001]本专利技术涉及深度学习
,特别是涉及一种人脸识别模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]随着计算机和深度学习技术的快速发展,深度学习模型在人脸识别领域的应用越来越广泛。目前基于深度学习的人脸识别模型需要使用全量人脸数据进行训练,训练后的人脸识别模型可以基于人的脸部特征信息进行身份识别,但使用源域数据训练的人脸识别模型在目标域的性能较差。
[0003]由于模型训练具有灾难性遗忘的特点,人脸识别模型单独使用目标域数据训练之后会遗忘在源域的识别性能。
[0004]在仅有少量存储空间可以存储少量源域数据的情况下,如何在目标域对人脸识别模型进行训练,才能使训练得到的人脸识别模型既可以保持源域的性能,又可以提升其在目标域的性能,以提高人脸识别模型的识别能力和精度,是亟需解决的问题。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种人脸识别模型的训练方法、装置、电子设备及存储介质,以保持人脸识别模型在源域的性能,又提升其在目标域的性能。具体技术方案如下:
[0006]第一方面,本专利技术实施例提供了一种人脸识别模型的训练方法,所述方法包括:
[0007]获取源域人脸特征以及初始化识别模型,其中,所述初始化识别模型基于源域的全量人脸图像样本训练得到,所述源域人脸特征为通过所述初始化识别模型获得的所述全量人脸图像样本的人脸特征;
[0008]获取目标域的目标人脸图像样本,其中,所述目标人脸图像样本对应的身份标签未知;
[0009]基于所述目标人脸图像样本以及所述源域人脸特征,调整所述初始化识别模型的部分模型参数,直到所述初始化识别模型收敛,得到针对源域和目标域的人脸识别模型。
[0010]可选的,所述获取源域人脸特征的步骤,包括:
[0011]按照预设筛选策略,对所述全量人脸图像样本进行筛选,得到筛选后的全量人脸图像样本,其中,所述预设筛选策略使得所述筛选后的全量人脸图像样本的数量不变的情况下,所述筛选后的全量人脸图像样本对应的身份信息数量不小于预设数量;
[0012]将所述筛选后的全量人脸图像样本输入所述初始化识别模型,获取所述初始化识别模型的中间层输出的人脸特征;
[0013]基于所述中间层输出的人脸特征,确定源域人脸特征。
[0014]可选的,所述初始化识别模型包括参数固定部分和待训练部分;
[0015]所述基于所述目标人脸图像样本以及所述源域人脸特征,调整所述初始化识别模
型的部分模型参数的步骤,包括:
[0016]将所述目标人脸图像样本输入所述参数固定部分和所述待训练部分,得到第一预测标签,并基于所述第一预测标签以及所述目标人脸图像样本对应的伪标签,确定第一分类损失;
[0017]将所述源域人脸特征输入所述待训练部分,得到第二预测标签,并基于所述第二预测标签以及所述源域人脸特征对应的身份标签,确定第二分类损失;
[0018]将所述源域人脸特征分别输入所述待训练部分以及所述待训练部分对应的初始部分,得到预估特征以及初始特征,并基于所述预估特征以及所述初始特征,确定约束损失,其中,所述初始部分为所述待训练部分的模型参数固定为基于所述全量人脸图像样本训练后的模型参数时对应的模型部分;
[0019]基于所述第一分类损失、所述第二分类损失及所述约束损失,调整所述待训练部分的模型参数。
[0020]可选的,在所述将所述目标人脸图像样本输入所述参数固定部分和所述待训练部分,得到第一预测标签的步骤之前,所述方法还包括:
[0021]对所述目标人脸图像样本进行聚类,确定每个目标人脸图像样本对应的伪标签,其中,所述伪标签用于标识对应的目标人脸图像样本所属的人员身份。
[0022]可选的,所述基于所述第一分类损失、所述第二分类损失及所述约束损失,调整所述待训练部分的模型参数的步骤,包括:
[0023]基于所述第一分类损失、所述第二分类损失及所述约束损失,按照以下公式计算得到损失函数值L:
[0024]L=L
c1
+L
c2
+λL
kd
[0025]其中,L
c1
为所述第一分类损失,L
c2
为所述第二分类损失,L
kd
为所述约束损失,λ为预设参数;
[0026]基于所述损失函数值,调整所述待训练部分的模型参数。
[0027]可选的,所述基于所述预估特征以及所述初始特征,确定约束损失的步骤,包括,
[0028]基于所述预估特征以及所述初始特征,按照以下公式计算得到所述约束损失L
kd

[0029][0030]其中,n为所述源域人脸特征的数量,F
i
为第i个源域人脸特征对应的初始特征,为第i个源域人脸特征对应的预估特征。
[0031]可选的,所述基于所述中间层输出的人脸特征,确定源域人脸特征的步骤,包括:
[0032]对所述中间层输出的人脸特征进行降维处理,得到降维后的人脸特征,作为源域人脸特征;
[0033]在所述基于所述目标人脸图像样本以及所述源域人脸特征,调整所述初始化识别模型的部分模型参数的步骤之前,所述方法还包括:
[0034]对所述源域人脸特征进行维度恢复处理,得到恢复后的源域人脸特征。
[0035]可选的,所述方法还包括:
[0036]获取所述目标域的待识别人脸图像;
[0037]基于所述人脸识别模型对所述待识别人脸图像进行识别,确定所述待识别人脸图像对应的身份。
[0038]第二方面,本专利技术实施例提供了一种人脸识别模型的训练装置,所述装置包括:
[0039]初始化训练模块,用于获取源域人脸特征以及初始化识别模型,其中,所述初始化识别模型基于源域的全量人脸图像样本训练得到,所述源域人脸特征为通过所述初始化识别模型获得的所述全量人脸图像样本的人脸特征;
[0040]目标域样本获取模块,用于获取目标域的目标人脸图像样本,其中,所述目标人脸图像样本对应的身份标签未知;
[0041]增量训练模块,用于基于所述目标人脸图像样本以及所述源域人脸特征,调整所述初始化识别模型的部分模型参数,直到所述初始化识别模型收敛,得到针对源域和目标域的人脸识别模型。
[0042]可选的,所述初始化训练模块包括:
[0043]样本筛选单元,用于按照预设筛选策略,对所述全量人脸图像样本进行筛选,得到筛选后的全量人脸图像样本,其中,所述预设筛选策略使得所述筛选后的全量人脸图像样本的数量不变的情况下,所述筛选后的全量人脸图像样本对应的身份信息数量不小于预设数量;
[0044]特征获取单元,用于将所述筛选后的全量人脸图像样本输入所述初始化识别模型,获取所述初始化识别模型的中间层输出的人脸特征;
[0045]特征确定单元,用于基于所述中间本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人脸识别模型的训练方法,其特征在于,所述方法包括:获取源域人脸特征以及初始化识别模型,其中,所述初始化识别模型基于源域的全量人脸图像样本训练得到,所述源域人脸特征为通过所述初始化识别模型获得的所述全量人脸图像样本的人脸特征;获取目标域的目标人脸图像样本,其中,所述目标人脸图像样本对应的身份标签未知;基于所述目标人脸图像样本以及所述源域人脸特征,调整所述初始化识别模型的部分模型参数,直到所述初始化识别模型收敛,得到针对源域和目标域的人脸识别模型。2.根据权利要求1所述的方法,其特征在于,所述获取源域人脸特征的步骤,包括:按照预设筛选策略,对所述全量人脸图像样本进行筛选,得到筛选后的全量人脸图像样本,其中,所述预设筛选策略使得所述筛选后的全量人脸图像样本的数量不变的情况下,所述筛选后的全量人脸图像样本对应的身份信息数量不小于预设数量;将所述筛选后的全量人脸图像样本输入所述初始化识别模型,获取所述初始化识别模型的中间层输出的人脸特征;基于所述中间层输出的人脸特征,确定源域人脸特征。3.根据权利要求1所述的方法,其特征在于,所述初始化识别模型包括参数固定部分和待训练部分;所述基于所述目标人脸图像样本以及所述源域人脸特征,调整所述初始化识别模型的部分模型参数的步骤,包括:将所述目标人脸图像样本输入所述参数固定部分和所述待训练部分,得到第一预测标签,并基于所述第一预测标签以及所述目标人脸图像样本对应的伪标签,确定第一分类损失;将所述源域人脸特征输入所述待训练部分,得到第二预测标签,并基于所述第二预测标签以及所述源域人脸特征对应的身份标签,确定第二分类损失;将所述源域人脸特征分别输入所述待训练部分以及所述待训练部分对应的初始部分,得到预估特征以及初始特征,并基于所述预估特征以及所述初始特征,确定约束损失,其中,所述初始部分为所述待训练部分的模型参数固定为基于所述全量人脸图像样本训练后的模型参数时对应的模型部分;基于所述第一分类损失、所述第二分类损失及所述约束损失,调整所述待训练部分的模型参数。4.根据权利要求3所述的方法,其特征在于,在所述将所述目标人脸图像样本输入所述参数固定部分和所述待训练部分,得到第一预测标签的步骤之前,所述方法还包括:对所述目标人脸图像样本进行聚类,确定每个目标人脸图像样本对应的伪标签,其中,所述伪标签用于标识对应的目标人脸图像样本所属的人员身份。5.根据权利要求3所述的方法,其特征在于,所述基于所述第一分类损失、所述第二分类损失及所述约束损失,调整所述待训练部分的模型参...

【专利技术属性】
技术研发人员:张烁
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1