一种人脸识别神经网络的训练方法及装置制造方法及图纸

技术编号：25523004 阅读：17 留言：0更新日期：2020-09-04 17:12

本发明专利技术公开了一种人脸识别神经网络的训练方法及装置，可以根据各人脸类别中心，获得用于约束不同的人脸类别样本的类间间隔的第一子损失值，根据用于约束相同的人脸类别样本的类内间隔的第二子损失函数，确定第二子损失值，根据第一子损失值和第二子损失值确定损失函数的总损失值，根据总损失值是否满足预设要求来确定是否对当前的人脸识别神经网络中的模型参数进行迭代更新。本发明专利技术可以有效提高人脸识别神经网络的人脸识别准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种人脸识别神经网络的训练方法及装置
本专利技术涉及图像识别领域，尤其涉及一种人脸识别神经网络的训练方法及装置。
技术介绍
随着图像识别技术的发展，人脸识别技术不断提高。当前，人脸识别神经网络是一项处于发展中的人脸识别技术。在进行人脸识别的过程中，人脸识别神经网络可以从待识别的目标人脸图像中提取出相应的人脸特征向量，将提取出的人脸特征向量与已存储在数据库中的多种类别的人脸图像的人脸特征向量进行相似度计算，根据相似度计算结果来确定目标人脸图像中人脸的身份信息。其中，数据库中存储的多种类别的人脸图像的人脸特征向量也是由人脸识别神经网络从相应的人脸图像中提取获得。人脸识别神经网络需确保存储在数据库中的多种类别的人脸图像的类内间隔较小、类间间隔较大，以保证人脸识别的准确度。但是，现有的人脸识别神经网络存储在数据库中的多种类别的人脸图像的类间间隔较小，导致人脸识别的准确度较低。
技术实现思路
鉴于上述问题，本专利技术提供一种克服上述问题或者至少部分地解决上述问题的人脸识别神经网络的训练方法及装置，技术方案如下：一种人脸识别神经网络的训练方法，所述方法包括：从人脸识别神经网络中获得训练样本的各个人脸类别中心，所述训练样本包括至少两个人脸类别样本的图像；将各个所述人脸类别中心输入至用于约束不同的人脸类别样本的类间间隔的第一子损失函数，以获得所述第一子损失函数输出的第一子损失值；根据用于约束相同的人脸类别样本的类内间隔的第二子损失函数，确定第二子损失值；r>根据所述第一子损失值和所述第二子损失值确定损失函数的总损失值；判断所述损失函数的总损失值是否满足预设要求，若是，结束对当前的人脸识别神经网络中的模型参数的调整；否则，对当前的人脸识别神经网络中的模型参数进行调整，以使得不同的人脸类别样本的类间间隔增大且相同的人脸类别样本的类内间隔减小，然后将调整后的人脸识别神经网络确定为当前的人脸识别神经网络，返回所述从人脸识别神经网络中获得训练样本的各个人脸类别中心的步骤。可选的，所述将各个所述人脸类别中心输入至用于约束不同的人脸类别样本的类间间隔的第一子损失函数，以获得所述第一子损失函数输出的第一子损失值，包括：对于获得的所述各个人脸类别中心中的两个人脸类别中心：将该两个人脸类别中心输入至中，获得该两个人脸类别中心之间的余弦相似度，其中：i、j均为人脸类别样本的编号，wi是编号为i的人脸类别样本的人脸类别中心，wj是编号为j的人脸类别样本的人脸类别中心，Mi，j是编号为i的人脸类别样本的人脸类别中心与编号为j的人脸类别样本的人脸类别中心之间的余弦相似度；根据获得的各所述余弦相似度确定第一子损失值。可选的，所述根据获得的各所述余弦相似度确定第一子损失值，包括：对于所述各个人脸类别中心中的任一人脸类别中心：在该人脸类别中心与其它人脸类别中心的各余弦相似度中确定最大值，该最大值为，其中：i、j均为人脸类别样本的编号，wi是编号为i的人脸类别样本的人脸类别中心，wj是编号为j的人脸类别样本的人脸类别中心，Mi是编号为i的人脸类别样本的人脸类别中心与其它人脸类别样本的人脸类别中心的各余弦相似度中的最大值；根据各所述最大值确定第一子损失值。可选的，所述根据各所述最大值确定第一子损失值，包括：将确定的各所述最大值输入至，确定第一子损失值，其中：i为人脸类别样本的编号，C是所述训练样本中人脸类别样本的总数，Mi是编号为i的人脸类别样本的人脸类别中心与其它人脸类别样本的人脸类别中心的各余弦相似度中的最大值，Mo为所述第一子损失值。可选的，所述第二子损失函数为：其中，C是所述训练样本中人脸类别样本的总数，i是人脸类别样本的编号，n为所述训练样本中人脸图像的编号，yn是编号为n的人脸图像所属的人脸类别样本的编号；1(yn＝＝i)为一个运算公式，若yn的值为i，则1(yn＝＝i)的结果为1，否则，1(yn＝＝i)的结果为0；xn为编号为n的人脸图像的特征向量，pyn(xn)为xn归属于人脸类别样本yn的后验概率，Ln是第二子损失值。可选的，所述pyn(xn)为：其中，n为所述训练样本中人脸图像的编号，xn是编号为n的人脸图像的特征向量，m为常量超参数，yn是编号为n的人脸图像所属的人脸类别样本的编号，θyn为xn与间的夹角，是编号为yn的人脸类别样本的人脸类别中心，C为训练样本中人脸类别样本的总数，j为人脸类别样本的编号，θj为xn与wj间的夹角，wj是编号为j的人脸类别样本的人脸类别中心，pyn(xn)为xn属于人脸类别样本yn的后验概率。可选的，所述根据所述第一子损失值和所述第二子损失值确定损失函数的总损失值，包括：将所述第一子损失值乘以第一实数以获得第三子损失值；将所述第二子损失值乘以第二实数以获得第四子损失值；将所述第三子损失值与所述第四子损失值相加所得的值确定为损失函数的总损失值。一种人脸识别神经网络的训练装置，所述装置包括：第一获得单元、第二获得单元、第一确定单元、第二确定单元、判断单元、停止调整单元和调整单元，其中：所述第一获得单元，用于从人脸识别神经网络中获得训练样本的各个人脸类别中心，所述训练样本包括至少两个人脸类别样本的图像；所述第二获得单元，用于将各个所述人脸类别中心输入至用于约束不同的人脸类别样本的类间间隔的第一子损失函数，以获得所述第一子损失函数输出的第一子损失值；所述第一确定单元，用于根据用于约束相同的人脸类别样本的类内间隔的第二子损失函数，确定第二子损失值；所述第二确定单元，用于根据所述第一子损失值和所述第二子损失值确定损失函数的总损失值；所述判断单元，用于判断所述损失函数的总损失值是否满足预设要求，若是触发所述停止调整单元，否则触发所述调整单元；所述停止调整单元，用于结束对当前的人脸识别神经网络中的模型参数的调整；所述调整单元，用于对当前的人脸识别神经网络中的模型参数进行调整，以使得不同的人脸类别样本的类间间隔增大且相同的人脸类别样本的类内间隔减小，然后将调整后的人脸识别神经网络确定为当前的人脸识别神经网络，触发所述第一获得单元。可选的，所述第二获得单元具体包括：第三获得单元和第三确定单元，其中：所述第三获得单元，用于对于获得的所述各个人脸类别中心中的两个人脸类别中心：将该两个人脸类别中心输入至中，获得该两个人脸类别中心之间的余弦相似度，其中：i、j均为人脸类别样本的编号，wi是编号为i的人脸类别样本的人脸类别中心，wj是编号为j的人脸类别样本的人脸类别中心，Mi，j是编号为i的人脸类别样本的人脸类别中心与编号为j的人脸类别样本的人脸类别中心之间的余弦相似度；所述第三确定单元，用于根据获得的各所述余弦相似度确定第一子损失值。可选的，所述第三确定单元具体包括：第四确定单元和第五确定单元，其中本文档来自技高网...

【技术保护点】
1.一种人脸识别神经网络的训练方法，其特征在于，所述方法包括：/n从人脸识别神经网络中获得训练样本的各个人脸类别中心，所述训练样本包括至少两个人脸类别样本的图像；/n将各个所述人脸类别中心输入至用于约束不同的人脸类别样本的类间间隔的第一子损失函数，以获得所述第一子损失函数输出的第一子损失值；/n根据用于约束相同的人脸类别样本的类内间隔的第二子损失函数，确定第二子损失值；/n根据所述第一子损失值和所述第二子损失值确定损失函数的总损失值；/n判断所述损失函数的总损失值是否满足预设要求，若是，结束对当前的人脸识别神经网络中的模型参数的调整；否则，对当前的人脸识别神经网络中的模型参数进行调整，以使得不同的人脸类别样本的类间间隔增大且相同的人脸类别样本的类内间隔减小，然后将调整后的人脸识别神经网络确定为当前的人脸识别神经网络，返回所述从人脸识别神经网络中获得训练样本的各个人脸类别中心的步骤。/n

【技术特征摘要】
1.一种人脸识别神经网络的训练方法，其特征在于，所述方法包括：
从人脸识别神经网络中获得训练样本的各个人脸类别中心，所述训练样本包括至少两个人脸类别样本的图像；
将各个所述人脸类别中心输入至用于约束不同的人脸类别样本的类间间隔的第一子损失函数，以获得所述第一子损失函数输出的第一子损失值；
根据用于约束相同的人脸类别样本的类内间隔的第二子损失函数，确定第二子损失值；
根据所述第一子损失值和所述第二子损失值确定损失函数的总损失值；
判断所述损失函数的总损失值是否满足预设要求，若是，结束对当前的人脸识别神经网络中的模型参数的调整；否则，对当前的人脸识别神经网络中的模型参数进行调整，以使得不同的人脸类别样本的类间间隔增大且相同的人脸类别样本的类内间隔减小，然后将调整后的人脸识别神经网络确定为当前的人脸识别神经网络，返回所述从人脸识别神经网络中获得训练样本的各个人脸类别中心的步骤。

2.根据权利要求1所述的训练方法，其特征在于，所述将各个所述人脸类别中心输入至用于约束不同的人脸类别样本的类间间隔的第一子损失函数，以获得所述第一子损失函数输出的第一子损失值，包括：
对于获得的所述各个人脸类别中心中的两个人脸类别中心：将该两个人脸类别中心输入至

中，获得该两个人脸类别中心之间的余弦相似度，其中：i、j均为人脸类别样本的编号，wi是编号为i的人脸类别样本的人脸类别中心，wj是编号为j的人脸类别样本的人脸类别中心，Mi，j是编号为i的人脸类别样本的人脸类别中心与编号为j的人脸类别样本的人脸类别中心之间的余弦相似度；
根据获得的各所述余弦相似度确定第一子损失值。

3.根据权利要求2所述的训练方法，其特征在于，所述根据获得的各所述余弦相似度确定第一子损失值，包括：
对于所述各个人脸类别中心中的任一人脸类别中心：在该人脸类别中心与其它人脸类别中心的各余弦相似度中确定最大值，该最大值为

，
其中：i、j均为人脸类别样本的编号，wi是编号为i的人脸类别样本的人脸类别中心，wj是编号为j的人脸类别样本的人脸类别中心，Mi是编号为i的人脸类别样本的人脸类别中心与其它人脸类别样本的人脸类别中心的各余弦相似度中的最大值；
根据各所述最大值确定第一子损失值。

4.根据权利要求3所述的训练方法，其特征在于，所述根据各所述最大值确定第一子损失值，包括：
将确定的各所述最大值输入至

，
确定第一子损失值，其中：i为人脸类别样本的编号，C是所述训练样本中人脸类别样本的总数，Mi是编号为i的人脸类别样本的人脸类别中心与其它人脸类别样本的人脸类别中心的各余弦相似度中的最大值，Mo为所述第一子损失值。

5.根据权利要求1所述的训练方法，其特征在于，所述第二子损失函数为：

其中，C是所述训练样本中人脸类别样本的总数，i是人脸类别样本的编号，n为所述训练样本中人脸图像的编号，yn是编号为n的人脸图像所属的人脸类别样本的编号；1(yn＝＝i)为一个运算公式，若yn的值为i，则1(yn＝＝i)的结果为1，否则，1(yn＝＝i)的结果为0；xn为编号为n的人脸图像的特征向量，为xn归属于人脸类别样本yn的后验概率，Ln是第二子损失值。

6.根据权利要求5所述的训练方法，其特征在于，所述为：

其中，n为所...

【专利技术属性】
技术研发人员：王洋，李骊，董晶，王亮，王鹏，
申请(专利权)人：北京华捷艾米科技有限公司，加减信息科技深圳有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人