人脸识别模型的训练方法及装置制造方法及图纸

技术编号:36929580 阅读:14 留言:0更新日期:2023-03-22 18:52
本公开涉及人脸识别技术领域,提供了一种人脸识别模型的训练方法及装置。该方法包括:利用人脸识别模型提取每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取每个第二样本的第二样本特征;计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练。别模型的训练。别模型的训练。

【技术实现步骤摘要】
人脸识别模型的训练方法及装置


[0001]本公开涉及人脸识别
,尤其涉及一种人脸识别模型的训练方法及装置。

技术介绍

[0002]现有的人脸识别模型包含基于比对的方式和基于分类的方式,基于比对的方式,需要构造大量的正负样本对,训练的目标是拉近正样本对的距离,拉远负样本对的距离,从而学习到有区分性的特征,这种称为样本对之间的比对;基于分类的方式是将每一类别用一个权重表示,该权重可以称作该类的原型或者类中心,训练目标为样本与该原型的比较过程。这两种方法均在训练阶段和推理阶段存在差异。
[0003]在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下技术问题:人脸识别模型在训练阶段和推理阶段存在差异的问题。

技术实现思路

[0004]有鉴于此,本公开实施例提供了一种人脸识别模型的训练方法、装置、电子设备及计算机可读存储介质,以解决现有技术中,人脸识别模型在训练阶段和推理阶段存在差异的问题。
[0005]本公开实施例的第一方面,提供了一种人脸识别模型的训练方法,包括:利用全局平均池化层、全连接层和激活层构建注意力模块;利用注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;获取训练数据集,为训练数据集生成历史样本队列,其中,训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,历史样本队列包括每个类中心下属的一个第二样本;利用人脸识别模型提取训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取历史样本队列中每个第二样本的第二样本特征;计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练。
[0006]本公开实施例的第二方面,提供了一种人脸识别模型的训练装置,包括:第一构建模块,被配置为利用全局平均池化层、全连接层和激活层构建注意力模块;第二构建模块,被配置为利用注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;获取模块,被配置为获取训练数据集,为训练数据集生成历史样本队列,其中,训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,历史样本队列包括每个类中心下属的一个第二样本;提取模块,被配置为利用人脸识别模型提取训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取历史样本队列中每个第二样本的第二样本特征;第一计算模块,被配置为计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样
本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;第二计算模块,被配置为根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;训练模块,被配置为基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练。
[0007]本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
[0008]本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0009]本公开实施例与现有技术相比存在的有益效果是:因为本公开实施例通过利用全局平均池化层、全连接层和激活层构建注意力模块;利用注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;获取训练数据集,为训练数据集生成历史样本队列,其中,训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,历史样本队列包括每个类中心下属的一个第二样本;利用人脸识别模型提取训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取历史样本队列中每个第二样本的第二样本特征;计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练,因此,采用上述技术手段,可以解决现有技术中,人脸识别模型在训练阶段和推理阶段存在差异的问题,进而避免人脸识别模型在训练阶段和推理阶段存在的差异,从而提高人脸识别模型的精度。
附图说明
[0010]为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0011]图1是本公开实施例的应用场景的场景示意图;
[0012]图2是本公开实施例提供的一种人脸识别模型的训练方法的流程示意图;
[0013]图3是本公开实施例提供的一种人脸识别模型的训练装置的结构示意图;
[0014]图4是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0015]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
[0016]下面将结合附图详细说明根据本公开实施例的一种人脸识别模型的训练方法和装置。
[0017]图1是本公开实施例的应用场景的场景示意图。该应用场景可以包括终端设备101、102和103、服务器104以及网络105。
[0018]终端设备101、102和103可以是硬件,也可以是软件。当终端设备101、102和103为硬件时,其可以是具有显示屏且支持与服务器104通信的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等;当终端设备101、102和103为软件时,其可以安装在如上的电子设备中。终端设备101、102和103可以实现为多个软件或软件模块,也可以实现为单个软件或软件模块,本公开实施例对此不作限制。进一步地,终端设备101、102和103上可以安装有各种应用,例如数据处理应用、即时通信工具、社交平台软件、搜索类应用、购物类应用等。
[0019]服务器104可以是提供各种服务的服务器,例如,对与其建立通信连接的终端设备发送的请求进行接收的后台本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人脸识别模型的训练方法,其特征在于,包括:利用全局平均池化层、全连接层和激活层构建注意力模块;利用所述注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;获取训练数据集,为所述训练数据集生成历史样本队列,其中,所述训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,所述历史样本队列包括每个类中心下属的一个第二样本;利用所述人脸识别模型提取所述训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用所述人脸识别模型提取所述历史样本队列中每个第二样本的第二样本特征;计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;基于所有第一样本和所有类中心对应的梯度,完成对所述人脸识别模型的训练。2.根据权利要求1所述的方法,其特征在于,利用全局平均池化层、全连接层和激活层构建注意力模块,包括:依次连接所述全局平均池化层、所述全连接层、所述激活层、所述全连接层和所述激活层,得到所述注意力模块。3.根据权利要求1所述的方法,其特征在于,利用所述注意力模块在残差网络模型中的每个残差模块后构建注意力分支,包括:将每个残差模块的输入记作第一特征,输出记作第二特征;将每个残差模块输出的第二特征输入该残差模块后的注意力分支,输出第三特征;将每个残差模块输出的第二特征与该残差模块后的注意力分支输出的第三特征相乘,得到第四特征;将输入每个残差模块的第一特征与其对应的第四特征相加,得到第五特征。4.根据权利要求1所述的方法,其特征在于,获取训练数据集,为所述训练数据集生成历史样本队列,包括:从所述训练数据集中每个类中心下属的多个第一样本中确定出一个第一样本作为该类中心下属的第二样本;将所有类中心下属的第二样本组成所述历史样本队列。5.根据权利要求1所述的方法,其特征在于,根据每个第一样本对应的第一余弦相似度和第二余弦相似度,计算所有第一样本和所有类中心对应的梯度,包括:对每个第一样本对应的第一余弦相似度和第二余弦相似度加权求和,得到该每个第一样本对应的第三余弦相似度;根据每个第一样本对应的第三余弦相似度,利用样本梯度公式计算所有第一样本对应的梯度;根据每个第一样本对应的第三余弦相似度,利用类中心梯度公式计算所有类中心对应...

【专利技术属性】
技术研发人员:蒋召黄泽元杨战波
申请(专利权)人:北京龙智数科科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1