特征提取网络的训练方法、人脸识别方法和装置制造方法及图纸

技术编号:31229361 阅读:15 留言:0更新日期:2021-12-08 09:58
本发明专利技术提供一种特征提取网络的训练方法、人脸识别方法和装置,适用于对大规模人脸数据库进行训练,先对人脸数据库中的样本进行聚类得到多个训练组,从M个训练组中分别采样一个样本得到训练批次,每个样本选取两张图片组成两个训练队列,分别输入两个模型进行训练,将两个模型提取的同一个样本的特征组成一个正样本对,需要训练的模型提取的特征和特征队列中的特征组成负样本对,根据正、负样本对的特征相似度计算损失函数,进一步采用动量更新方式更新两个模型的参数和特征队列。上述方法避免了模型训练时采用全连接层进行分类时产生的巨大参数量,该方法在占用显存较少的情况下,能够快速训练得到精度较高的模型。能够快速训练得到精度较高的模型。能够快速训练得到精度较高的模型。

【技术实现步骤摘要】
特征提取网络的训练方法、人脸识别方法和装置


[0001]本专利技术涉及深度学习技术,尤其涉及一种特征提取网络的训练方法、人脸识别方法和装置。

技术介绍

[0002]人脸识别模型的训练依赖大量训练数据,随着人脸识别技术的发展,可用于模型训练的公开数据也在急速增长。从起初的几百或者几千人的级别,增长到了几万或者几十万的级别。此外在工业界,各大厂商内部的私有数据更是达到百万级甚至亿级,如何采用有限的训练资源对百万级甚至亿级人的人脸数据库进行训练是一个极具挑战性的问题。
[0003]由于采用常规深度神经网络训练人脸识别模型时,最后一层需要用一个全联接层对网络提取的特征进行分类,而全联接层参数量极大。假设输入的一个批次样本数为N个,神经网络提取的特征维度为F,总的分类人数为C,则全联接层的参数量为N*F*C,通常每个参数所占空间为4个字节,则全联接层需要占用显存大小为N*F*C*4个字节。按照最常见的配置:N=512,F=512,若C=10万,则所需显存大小等于512*512*10^5*4字节,约等于97.6G,若C=100万,则需要976G,而这仅仅是一个全联接层所需的显存大小,其他卷基层等也需要占用不少显存。目前主流的图形处理单元(Graphics Processing Unit,简称GPU),单卡显存一般不超过24G,所以无法直接支持海量人脸数据的训练。目前,一种方式采用传统度量学习,对于人物数量极大的数据库进行训练时,对神经网络提取的特征采用Contrastive Loss或Triplet Loss进行学习,这样不用对特征再采用全联接层进行分类,免去了全联接层的巨大参数量,从而可以按批次对所有样本进行训练。
[0004]对于传统度量学习而言,如何选择每次训练的正样本对和负样本对是一个非常复杂并充满技巧性的工作,常常采用各种难样本挖掘方法来选择每次训练的正负样本对。但是难样本挖掘本身比较耗时,会导致训练的速度非常缓慢。另外,如果没有采用分类训练预训练好的模型作为初始化模型,直接采用传统度量学习训练出的模型往往难以达到较高的精度。

技术实现思路

[0005]本专利技术提供一种特征提取网络的训练方法、人脸识别方法和装置,能够对大规模人脸数据库进行训练。
[0006]本专利技术第一方面提供一种特征提取网络的训练方法,包括:
[0007]对人脸数据库中的样本进行聚类,得到多个训练组,每个训练组中的样本较为相似;
[0008]从M个训练组中采样M个样本,M为训练批次的大小,每个训练组中选择一个样本;
[0009]从所述M个训练组中获取所述M个样本的两张图片,组成第一训练队列和第二训练队列,所述第一训练队列和所述第二训练队列中分别包括所述M个样本的一张图片;
[0010]将所述第一训练队列输入第一特征提取网络,将所述第二训练队列输入第二特征
提取网络;
[0011]根据正样本对的特征相似度以及负样本对的特征相似度计算损失函数,其中,所述第一特征提取网络和所述第二特征提取网络提取的同一个样本的特征组成一个正样本对,所述第一特征提取网络提取的特征和特征队列中的特征组成负样本对,所述特征队列用于存储所述第二特征提取网络提取的之前训练批次的样本的特征;
[0012]根据所述损失函数更新所述第一特征提取网络的参数;
[0013]根据所述第一特征提取网络的更新后的参数,采用动量参数更新方法更新所述第二特征提取网络的参数;
[0014]在所述训练批次训练结束后,将所述第二特征提取网络提取到的特征更新到所述特征队列中;
[0015]从所述多个训练组中采样得到下一个训练批次,执行上述训练过程直至所述人脸数据库中的所有样本都被训练一次,则结束当前训练周期。
[0016]可选的,所述对人脸数据库中的样本进行聚类,得到多个训练组,包括:
[0017]采用所述人脸数据库中的部分数据预先训练得到第三特征提取模型;
[0018]采用所述第三特征提取模型提取所述人脸数据库中的所有图片的特征;
[0019]根据所述人脸数据库中的所有图片的特征对所述人脸数据库中的样本进行聚类,得到所述多个训练组。
[0020]可选的,所述根据正样本对的特征相似度以及负样本对的特征相似度计算损失函数,包括:
[0021]通过如下公式计算所述损失函数:
[0022][0023]其中,Loss表示所述损失函数,M表示所述训练批次的大小,feat
i1
表示所述M个样本中第i个样本通过所述第一特征提取网络提取到的特征,feat
i2
表示所述M个样本中第i个样本通过所述第二特征提取网络提取到的特征,m为特征间隔,s为缩放系数,K表示所述特征队列的大小,feat
j
表示所述特征队列中的第j个特征,M、m、s和K均为预先设置的固定值,.用于计算两个特征的相似度。
[0024]可选的,所述根据所述第一特征提取网络的更新后的参数,采用动量参数更新方法更新所述第二特征提取网络的参数,包括:
[0025]根据如下公式更新所述第二特征提取网络的参数:
[0026]θ2=mθ2+(1

m)θ1[0027]其中,θ2表示所述第二特征提取网络的参数,θ1表示所述第一特征提取网络的参数,m为动量,m的取值为大于0且小于1。
[0028]可选的,在所述训练批次训练结束后,将所述第二特征提取网络提取到的特征更新到所述特征队列中,包括:
[0029]当所述特征队列未溢出时,将所述第二特征提取网络提取到的特征插入上一训练批次对应的特征之后;或者,
[0030]当所述特征队列溢出时,从所述特征队列中删除最早插入的M个特征,将所述第二
特征提取网络提取到的特征插入上一训练批次对应的特征之后。
[0031]可选的,当所述人脸数据库中所有样本都被训练一次之后,清空所述特征队列,进入下一个训练周期。
[0032]可选的,所述从所述M个训练组中获取所述M个样本的两张图片,包括:
[0033]针对所述M个样本中的任一样本,当所述样本对应的训练组中存在多张图片时,从所述多张图片中选取所述样本的两张图片;或者,
[0034]当所述样本对应的训练组中只存在一张图片时,对存在的一张图片进行变换得到所述样本的另一张图片。
[0035]可选的,所述根据所述损失函数更新所述第一特征提取网络的参数,包括:
[0036]根据所述损失函数采用随机梯度下降法对所述第一特征提取网络的参数进行更新。
[0037]本专利技术第二方面提供一种人脸识别方法,所述方法包括:
[0038]将待识别图片输入到特征提取网络中,得到所述待识别图片的特征,所述特征提取网络为采用上述第一方面所述方法训练得到的第一特征提取网络;
[0039]计算所述待识别图片的特征与存储的目标图片的特征的相似度,所述目标图片的特征采用所述特征提取网络提取得到;
[004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
其中,θ2表示所述第二特征提取网络的参数,θ1表示所述第一特征提取网络的参数,m为动量,m的取值为大于0且小于1。5.根据权利要求1

4任一项所述的方法,其特征在于,在所述训练批次训练结束后,将所述第二特征提取网络提取到的特征更新到所述特征队列中,包括:当所述特征队列未溢出时,将所述第二特征提取网络提取到的特征插入上一训练批次对应的特征之后;或者,当所述特征队列溢出时,从所述特征队列中删除最早插入的M个特征,将所述第二特征提取网络提取到的特征插入上一训练批次对应的特征之后。6.根据权利要求5所述的方法,其特征在于,当所述人脸数据库中所有样本都被训练一次之后,清空所述特征队列,进入下一个训练周期。7.根据权利要求1

4任一项所述的方法,其特征在于,所述从所述M个训练组中获取所述M个样本的两张图片,包括:针对所述M个样本中的任一样本,当所述样本对应的训练组中存在多张图片时,从所述多张图片中选取所述样本的两张图片;或者,当所述样本对应的训练组中只存在一张图片时,对存在的一张图片进行变换得到所述样本的另一张图片。8.根据权利要求1

4任一项所述的方法,其特征在于,所述根据所述损失函数更新所述第一特征提取网络的参数,包括:根据所述损失函数采用随机梯度下降法对所述第一特征提取网络的参数进行更新。9.一种人脸识别方法,其特征在于,所述方法包括:将待识别图片输入到特征提取网络中,得到所述待识别图片的特征,所述特征提取网络为采用权利要求1

8任一项所述方法训练得到的第一特征提取网络;计算所述待识别图片的特征与存储的目标图片的特征的相似度,所述目标图片的特征采用所述特征提取网络提取得到;根据所述相似度得到所述待识别图片的识别结果。10.一种特征提取网络的训练装置,其特征在于,包括:聚类模块,用于对人脸数据库中的样本进行聚类,得到多个训练组,每个训练组中的样本较为相似;采样模块,用于从M个训练组中采样M个样本,M为训练批次的大小,每个训练组中选择一个样本;所述采样模块,还用于...

【专利技术属性】
技术研发人员:王军石海林王林芳梅涛周伯文
申请(专利权)人:北京京东世纪贸易有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1