人脸识别模型的训练方法及装置制造方法及图纸

技术编号：36929580 阅读：14 留言：0更新日期：2023-03-22 18:52

本公开涉及人脸识别技术领域，提供了一种人脸识别模型的训练方法及装置。该方法包括：利用人脸识别模型提取每个类中心的类中心特征和每个第一样本的第一样本特征，利用人脸识别模型提取每个第二样本的第二样本特征；计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度，计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度；根据每个第一样本对应的第一余弦相似度和第二余弦相似度，分别计算所有第一样本和所有类中心对应的梯度；基于所有第一样本和所有类中心对应的梯度，完成对人脸识别模型的训练。别模型的训练。别模型的训练。

全部详细技术资料下载

【技术实现步骤摘要】
人脸识别模型的训练方法及装置

[0001]本公开涉及人脸识别
，尤其涉及一种人脸识别模型的训练方法及装置。

技术介绍

[0002]现有的人脸识别模型包含基于比对的方式和基于分类的方式，基于比对的方式，需要构造大量的正负样本对，训练的目标是拉近正样本对的距离，拉远负样本对的距离，从而学习到有区分性的特征，这种称为样本对之间的比对；基于分类的方式是将每一类别用一个权重表示，该权重可以称作该类的原型或者类中心，训练目标为样本与该原型的比较过程。这两种方法均在训练阶段和推理阶段存在差异。
[0003]在实现本公开构思的过程中，专利技术人发现相关技术中至少存在如下技术问题：人脸识别模型在训练阶段和推理阶段存在差异的问题。

技术实现思路

[0004]有鉴于此，本公开实施例提供了一种人脸识别模型的训练方法、装置、电子设备及计算机可读存储介质，以解决现有技术中，人脸识别模型在训练阶段和推理阶段存在差异的问题。
[0005]本公开实施例的第一方面，提供了一种人脸识别模型的训练方法，包括：利用全局平均池化层、全连接层和激活层构建注意力模块；利用注意力模块在残差网络模型中的每个残差模块后构建注意力分支，得到人脸识别模型；获取训练数据集，为训练数据集生成历史样本队列，其中，训练数据集，包括：多个类中心以及每个类中心下属的多个第一样本，历史样本队列包括每个类中心下属的一个第二样本；利用人脸识别模型提取训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征，利用人脸识别模型提取历史样本队列中每个第二...

【技术保护点】

【技术特征摘要】
1.一种人脸识别模型的训练方法，其特征在于，包括：利用全局平均池化层、全连接层和激活层构建注意力模块；利用所述注意力模块在残差网络模型中的每个残差模块后构建注意力分支，得到人脸识别模型；获取训练数据集，为所述训练数据集生成历史样本队列，其中，所述训练数据集，包括：多个类中心以及每个类中心下属的多个第一样本，所述历史样本队列包括每个类中心下属的一个第二样本；利用所述人脸识别模型提取所述训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征，利用所述人脸识别模型提取所述历史样本队列中每个第二样本的第二样本特征；计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度，计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度；根据每个第一样本对应的第一余弦相似度和第二余弦相似度，分别计算所有第一样本和所有类中心对应的梯度；基于所有第一样本和所有类中心对应的梯度，完成对所述人脸识别模型的训练。2.根据权利要求1所述的方法，其特征在于，利用全局平均池化层、全连接层和激活层构建注意力模块，包括：依次连接所述全局平均池化层、所述全连接层、所述激活层、所述全连接层和所述激活层，得到所述注意力模块。3.根据权利要求1所述的方法，其特征在于，利用所述注意力模块在残差网络模型中的每个残差模块后构建注意力分支，包括：将每个残差模块的输入记作第一特征，输出记作第二特征；将每个残差模块输出的第二特征输入该残差模块后的注意力分支，输出第三特征；将每个残差模块输出的第二特征与该残差模块后的注意力分支输出的第三特征相乘，得到第四特征；将输入每个残差模块的第一特征与其对应的第四特征相加，得到第五特征。4.根据权利要求1所述的方法，其特征在于，获取训练数据集，为所述训练数据集生成历史样本队列，包括：从所述训练数据集中每个类中心下属的多个第一样本中确定出一个第一样本作为该类中心下属的第二样本；将所有类中心下属的第二样本组成所述历史样本队列。5.根据权利要求1所述的方法，其特征在于，根据每个第一样本对应的第一余弦相似度和第二余弦相似度，计算所有第一样本和所有类中心对应的梯度，包括：对每个第一样本对应的第一余弦相似度和第二余弦相似度加权求和，得到该每个第一样本对应的第三余弦相似度；根据每个第一样本对应的第三余弦相似度，利用样本梯度公式计算所有第一样本对应的梯度；根据每个第一样本对应的第三余弦相似度，利用类中心梯度公式计算所有类中心对应...

【专利技术属性】
技术研发人员：蒋召，黄泽元，杨战波，
申请(专利权)人：北京龙智数科科技服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人