神经网络的训练方法及装置、人脸识别方法及装置制造方法及图纸

技术编号:34402750 阅读:15 留言:0更新日期:2022-08-03 21:44
本公开提供了一种神经网络的训练方法及装置、人脸识别方法及装置,其中,训练方法包括:获取第一图像和至少预设数量张第二图像,第二图像与第一图像具有相同的图像标签;利用目标神经网络模型对第一图像进行特征提取,得到第一特征信息,并利用目标神经网络模型的滑动平均模型,分别对每张第二图像进行特征提取,得到至少预设数量个第二特征信息;基于第一特征信息和每个第二特征信息之间的第一相似度,确定第一损失系数,并基于第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度,确定第二损失系数;基于第一损失系数和第二损失系数,确定目标损失,利用目标损失对目标神经网络模型进行迭代训练,得到训练好的目标神经网络模型。好的目标神经网络模型。好的目标神经网络模型。

【技术实现步骤摘要】
神经网络的训练方法及装置、人脸识别方法及装置


[0001]本公开涉及图像识别
,具体而言,涉及一种神经网络的训练方法及装置、人脸识别方法及装置。

技术介绍

[0002]随着计算机视觉技术的快速发展,人脸识别技术在人们的日常生活中发挥着越来越重要的作用。人脸识别技术大多依赖人脸识别神经网络,而人脸识别神经网络的识别精度与人脸训练数据的规模息息相关。
[0003]在利用人脸训练数据进行网络训练的过程中,需要为每个类别的人脸标签存储一个锚点(anchor)特征以用于确定网络损失。这样,使用大量不同类别的人脸训练数据进行网络训练,需要存储大量的锚点特征。如此,极大增加了数据存储压力和计算资源消耗,而且受限于人脸训练数据的采集难度,导致采集的人脸训练数据大多为带有噪声的数据。利用带有噪声的人脸训练数据进行网络训练,降低了人脸识别神经网络对噪声的鲁棒性。

技术实现思路

[0004]本公开实施例至少提供一种神经网络的训练方法及装置、人脸识别方法及装置。
[0005]第一方面,本公开实施例提供了一种神经网络的训练方法,包括:
[0006]获取第一图像和至少预设数量张第二图像,所述第二图像与所述第一图像具有相同的图像标签;
[0007]利用目标神经网络模型对所述第一图像进行特征提取,得到第一特征信息,并利用所述目标神经网络模型的滑动平均模型,分别对每张所述第二图像进行特征提取,得到至少预设数量个第二特征信息;
[0008]基于所述第一特征信息和每个所述第二特征信息之间的第一相似度,确定第一损失系数,并基于所述第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度,确定第二损失系数;每个所述历史特征组中包括的第三特征信息为在进行当前轮训练之前,在其他轮训练中利用其他第二图像确定的;
[0009]基于所述第一损失系数和所述第二损失系数,确定目标损失,并利用所述目标损失对所述目标神经网络模型进行迭代训练,直至满足训练截止条件,得到训练好的目标神经网络模型。
[0010]该实施方式,基于从第一图像中提取的第一特征信息和从每张第二图像中提取的第二特征信息之间的第一相似度,确定第一损失系数,无需存储和使用图像标签对应的锚点特征,即可确定模型在预测具有相同标签的图像时的损失,降低了训练过程的数据存储压力和计算资源消耗。由于第三特征信息为其他轮训练中利用其他第二图像确定的,所以第三特征信息相当于第一特征信息的噪声数据,而基于第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度,确定第二损失系数,再基于第二损失系数确定目标损失并利用目标损失对模型进行训练,可以实现对噪声数据的消除,降低噪声数据对模型识
别精度的影响,提高训练好的目标神经网络模型的识别精度和对噪声的鲁棒性。
[0011]在一种可能的实施方式中,所述第一图像和第二图像为人脸图像,所述目标神经网络模型为人脸识别模型。
[0012]该实施方式,按照本公开实施例提供的训练方法,利用人脸图像对人脸识别模型进行训练,既可以降低了训练过程的数据存储压力和计算资源消耗,还可以提高训练好的人脸识别模型的人脸识别精度和对人脸噪声的鲁棒性。
[0013]在一种可能的实施方式中,所述基于所述第一特征信息和每个所述第二特征信息之间的第一相似度,确定第一损失系数,包括:
[0014]从所述至少预设数量个所述第一相似度中,筛选出最大相似度,并基于所述最大相似度和预设的分隔值之间的第一差值,确定所述第一损失系数。
[0015]该实施方式,由于第一图像和第二图像具有相同图像标签,所以第一特征信息和第二特征信息之间的相似度越高,第二特征信息与图像标签对应的锚点特征越接近。通过选取至少预设数量个第一相似度中的最大相似度,也即得到了与图像标签对应的锚点特征最接近的第二特征信息和第一特征信息之间的相似度,利用该相似度确定第一损失系数,可以提高确定的第一损失系数的准确性。并且,利用预设的分隔值对最大相似度进行处理,可以提高具有不同类别图像标签的图像之间的区分度,利用处理后得到的第一差值确定第一损失系数,并利用基于第一损失系数确定的目标损失对目标神经网络模型进行训练,可以提高目标神经网络模型在识别具有不同类别图像标签的图像时,输出的特征信息的区分度。
[0016]在一种可能的实施方式中,所述基于所述第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度,确定第二损失系数,包括:
[0017]针对每个历史特征组,基于该历史特征组中的每个所述第三特征信息与所述第一特征信息之间的第二相似度,确定该历史特征组对应的最小相似度;
[0018]基于每个所述历史特征组的组标签,从所述历史特征组中筛选出所述组标签与所述第一图像的图像标签不一致的目标历史特征组;所述组标签为用于提取所述历史特征组中任一所述第三特征信息的其他第二图像的图像标签;
[0019]基于每个所述目标历史特征组分别对应的最小相似度,确定所述第二损失系数。
[0020]该实施方式,利用各个历史特征组的组标签与第一图像的图像标签,对历史特征组进行筛选,可以剔除组标签与第一图像的图像标签一致的历史特征组,降低该历史特征组对模型鲁棒性的影响,同时,可以筛选出组标签与第一图像的图像标签不一致的目标历史特征组。利用每个目标历史特征组分别对应的最小相似度,确定第二损失系数,再利用基于第二损失系数确定的目标损失对目标神经网络模型进行训练,可以提高目标神经网络模型对图像噪声的鲁棒性。
[0021]在一种可能的实施方式中,在所述基于所述第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度,确定第二损失系数之前,还包括:
[0022]根据所述第二特征信息的数量和预设分组值,将所述至少预设数量个所述第二特征信息,划分至多个当前特征组中;
[0023]在所述历史特征组和所述当前特征组的数量之和大于预设组数量的情况下,确定所述数量之和与所述预设组数量之间的第二差值;
[0024]按照每个所述历史特征组的生成时间的先后顺序,对每个所述历史特征组进行排序,得到每个所述历史特征组的排序值;
[0025]删除排序值不大于所述第二差值的各个所述历史特征组。
[0026]该实施方式,通过将至少预设数量个个第二特征信息,划分至多个当前特征组中,可以实现对应于第一图像的图像标签的第一特征信息、第二特征信息与对应于其他图像标签的第三特征信息之间的解耦。通过删除排序值不大于第二差值的各个历史特征组,也即实现了对存储时间长的历史特征组的删除,保障了保留下来的各个特征组中的特征信息的时效性。
[0027]在一种可能的实施方式中,在所述删除排序值不大于所述第二差值的各个所述历史特征组之后,还包括:
[0028]保留每个所述当前特征组,其中,保留下来的每个所述当前特征组作为下一轮训练的历史特征组。
[0029]该实施方式,通过保留当前特征组,可以实现对时效性最强的特征组的保留,为下一轮迭代训练提供最新可使本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种神经网络的训练方法,其特征在于,包括:获取第一图像和至少预设数量张第二图像,所述第二图像与所述第一图像具有相同的图像标签;利用目标神经网络模型对所述第一图像进行特征提取,得到第一特征信息,并利用所述目标神经网络模型的滑动平均模型,分别对每张所述第二图像进行特征提取,得到至少预设数量个第二特征信息;基于所述第一特征信息和每个所述第二特征信息之间的第一相似度,确定第一损失系数,并基于所述第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度,确定第二损失系数;每个所述历史特征组中包括的第三特征信息为在进行当前轮训练之前,在其他轮训练中利用其他第二图像确定的;基于所述第一损失系数和所述第二损失系数,确定目标损失,并利用所述目标损失对所述目标神经网络模型进行迭代训练,直至满足训练截止条件,得到训练好的目标神经网络模型。2.根据权利要求1所述的方法,其特征在于,所述第一图像和第二图像为人脸图像,所述目标神经网络模型为人脸识别模型。3.根据权利要求1或2所述的方法,其特征在于,所述基于所述第一特征信息和每个所述第二特征信息之间的第一相似度,确定第一损失系数,包括:从所述至少预设数量个所述第一相似度中,筛选出最大相似度,并基于所述最大相似度和预设的分隔值之间的第一差值,确定所述第一损失系数。4.根据权利要求1至3任一项所述的方法,其特征在于,所述基于所述第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度,确定第二损失系数,包括:针对每个历史特征组,基于该历史特征组中的每个所述第三特征信息与所述第一特征信息之间的第二相似度,确定该历史特征组对应的最小相似度;基于每个所述历史特征组的组标签,从所述历史特征组中筛选出所述组标签与所述第一图像的图像标签不一致的目标历史特征组;所述组标签为用于提取所述历史特征组中任一所述第三特征信息的其他第二图像的图像标签;基于每个所述目标历史特征组分别对应的最小相似度,确定所述第二损失系数。5.根据权利要求1至3任一项所述的方法,其特征在于,在所述基于所述第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度,确定第二损失系数之前,还包括:根据所述第二特征信息的数量和预设分组值,将所述至少预设数量个所述第二特征信息,划分至多个当前特征组中;在所述历史特征组和所述当前特征组的数量之和大于预设组数量的情况下,确定所述数量之和与所述预设组数量之间的第二差值;按照每个所述历史特征组的生成时间的先后顺序,对每个所述历史特征组进行排序,得到每个所述历史特征组的排序值;删除排序值不大于所述第二差值的各个所述历史特征组。6.根据权利要求5所述的方法,其特征在于,在所述删除排序值不大于所述第二差值的各个所述历史特征组之后,还包括:保留每个所述当前特征组,其中,保留下来的每个所述当前特征组作为下一轮训练的
历史特征组。7.根据权利要求1至3任一项所述的方法,其特征在于,所述基于所述第一特征信息与至少部分历史特征组中的第三特征信息的第二相似度,确定第二损失系数,包括:基于每个历史特征组的组标签,从所述历史特征组中筛选出所述组标签与所述第一图像的图像标签不一致的目标历史特征组;针对每个目标...

【专利技术属性】
技术研发人员:刘博晓宋广录刘宇
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1