当前位置: 首页 > 专利查询>之江实验室专利>正文

一种实时更新余弦夹角损失函数参数的人脸识别方法技术

技术编号:27937300 阅读:29 留言:0更新日期:2021-04-02 14:17
本发明专利技术提出了一种实时更新余弦夹角损失函数参数的人脸识别方法,属于计算机视觉中的人脸识别领域。该方法包括:(1)收集人脸图像,并将人脸图像按个体分类,并对每个人脸图像进行数据标注;(2)对人脸图像进行图像预处理,得到人脸图像数据集;(3)初始化余弦夹角损失函数的的余弦值放大尺度和余弦夹角间隔;(4)将图像数据集送入卷积神经网络,实时计算更新余弦值放大尺度和余弦夹角间隔,直至完成对卷积神经网络的训练,(5)将需要进行比对判断的人脸图像输入训练好的卷积神经网络中,输出人脸特征向量,用于进行人脸识别匹配。本发明专利技术的人脸识别方法具有训练收敛速度快,识别准确率高的特点。

【技术实现步骤摘要】
一种实时更新余弦夹角损失函数参数的人脸识别方法
本专利技术属于计算机视觉中的人脸识别领域,尤其涉及到一种基于自适应学习机制实时更新余弦夹角损失函数参数的人脸识别方法。
技术介绍
随着计算机视觉技术的发展以及日渐增长的智能安防、电子商务等需求,人脸识别技术成为人工智能应用产品落地最为广泛的一个领域。使用深度学习方法的人脸识别技术核心在于通过卷积神经网络(CNN)抽象化出人脸图像的特征,用于计算人脸图像之间的相似度,进而实现人脸识别的功能。在人脸识别的实际应用中,往往受到摄像头成像、光照、面部遮挡等因素的影响,造成识别能力下降,从而影响最终识别结果。特别在金融、安防等重要场景,错误的人脸识别结果可能造成不可估量的影响。因而如何训练出一个能精确提取人脸特征的卷积神经网络成为计算机视觉技术中心一个重要的研究课题。在卷积神经网络训练过程中,损失函数的选取对最终的特征提取能力有决定性的影响。为了提升人脸识别模型的判别性能,近年来一系列加入间隔抑制的余弦夹角损失函数,如A-Softmax,CosFace,ArcFace开始成为训练人脸识别模型的主流方法。这些余弦夹角损失函数的共同之处在于均使用了余弦角间隔和对余弦值尺度放大的方式进行模型训练,然而模型的余弦角间隔值和余弦值放大的尺度值需要在训练前预先确定。这两个参数对模型训练的最终结果有决定性的影响,过小的参数值会造成模型的判别能力变弱,而过大的参数值虽然有利于提升模型的最终能力,但在训练初期会导致模型难以收敛。目前主流的做法是在人脸识别模型的训练任务中针对不同的参数选取进行多组对比性实验,依据实验结果选取合适的参数取值。然而这种方式随机性大,而且随着训练数据的迭代变换,之前获取的最佳取值可能会不适用于新的数据与网络。在网络训练的过程中,训练早期模型性能较弱,需要较小的参数值来帮助模型快速收敛,而在训练后期模型性能逐渐增强,这时需要更大的参数值来加强模型的判别能力。为了解决上述问题,如何设计一种随着网络训练进程自动更新参数的余弦夹角损失函数成为进一步提升人脸识别模型性能的一个重要方向。
技术实现思路
本专利技术的目的在于针对现有技术的不足,提出了一种实时更新余弦夹角损失函数参数的人脸识别方法,用于人脸识别模型的训练。摆脱了传统余弦夹角损失函数需要预先确定间隔值和尺度值的限制,该人脸识别方法适用于不同的人脸识别网络和数据集,并且能随着训练进程自适应地调节参数值,加速卷积神经网络的收敛,该方法的人脸识别能力更强。本专利技术为实现上述目的,采用了以下技术方案:一种实时更新余弦夹角损失函数参数的人脸识别方法,包括以下步骤:(1)收集人脸图像,并将人脸图像按个体进行分类,并按照分类的结果对每个人脸图像进行数据标注;(2)将步骤(1)收集的人脸图像进行水平翻转、去噪、亮度增强和对比度增强处理后,得到人脸图像数据集,将所述人脸图像数据集分批;(3)初始化余弦夹角损失函数的余弦值放大尺度和余弦夹角间隔,根据初始化的余弦值放大尺度和余弦夹角间隔,得到余弦夹角损失函数;(4)将第一批人脸图像数据集输入卷积神经网络中进行人脸类别训练,根据所述卷积神经网络中Softmax层的输出的人脸图像的特征向量,计算每个人脸图像的特征向量与目标类别的特征向量的夹角,并获得夹角的中位数,同时更新余弦值放大尺度;随后计算每个人脸图像的特征向量与目标类别的特征向量和非目标类别的特征向量的余弦夹角指数值之和,并获得余弦夹角指数值之和的中位数,更新余弦夹角间隔;将更新的余弦值放大尺度和余弦夹角间隔分别与初始化的余弦值放大尺度和余弦夹角间隔进行比较,选取其中较大者作为更新的结果;(5)分批将人脸图像数据集输入卷积神经网络中进行人脸类别训练,重复步骤(4),更新余弦值放大尺度和余弦夹角间隔,直至所述余弦夹角损失函数收敛,完成对卷积神经网络的训练;(6)将需要进行比对判断的人脸图像输入训练好的卷积神经网络中,经卷积神经网络中Softmax层输出人脸图像的特征向量,求出与目标图像经过本网络提取出的特征向量的余弦夹角,所述余弦夹角的相似度超过阈值时,输出人脸识别匹配正确的结果。进一步地,所述更新余弦值放大尺度的过程为:其中,s为余弦值放大尺度,C为一批输入的人脸图像的类别数,为夹角的中位数。进一步地,所述更新余弦夹角间隔的过程为:其中,m为余弦夹角间隔,为余弦夹角指数值之和的中位数。与现有技术相比,本专利技术的有益效果是:本专利技术的人脸识别方法中将余弦夹角损失函数的参数值与每一步训练输入的人脸图像直接联系,而与其他步训练所用的人脸图像无关,依据余弦值放大尺度s和余弦夹角间隔m实时更新余弦夹角损失函数,且该余弦夹角损失函数适用于各种人脸识别模型中。在卷积神经网络的训练中,可以用来衡量卷积神经网络的收敛程度和性能,越小表明卷积神经网络预测的类别与图像真实类别越接近。在训练初期,的中位数相对较大,余弦值放大尺度s和余弦夹角间隔m的值较小,有利于卷积神经网络的快速收敛;当训练到后期,进一步缩小,而更新的余弦值放大尺度s和余弦夹角间隔m的值变大,强化余弦夹角损失函数的监督信号,进而提升卷积神经网络人脸识别的判别性能。因此,本专利技术的人脸识别方法具有训练收敛速度快,识别准确率高的特点。附图说明图1为本专利技术实时更新余弦夹角损失函数参数的人脸识别方法的流程图。具体实施方式为使本专利技术的目的、技术方案更加清楚,下面结合附图对本专利技术作进一步说明。如图1所示,本专利技术提供了一种实时更新余弦夹角损失函数参数的人脸识别方法流程图,所述人脸识别方法包括如下步骤:(1)收集人脸图像,并将人脸图像按个体进行分类,并按照分类的结果对每个人脸图像进行数据标注;(2)将步骤(1)收集的人脸图像进行水平翻转、去噪、亮度增强和对比度增强处理后,得到人脸图像数据集,将所述人脸图像数据集分批;(3)初始化余弦夹角损失函数的余弦值放大尺度s和余弦夹角间隔m,令,,所述余弦夹角损失函数为:其中,n为一批输入卷积神经网络的人脸图像的数量,i为n的索引,为目标类别的特征向量,j为非目标类别的特征向量,为输入的第i张人脸图像的特征向量与之间的夹角,为输入的第i张人脸图像的特征向量与j之间的夹角,C为一批输入的人脸图像的类别数。由于在模型训练起始阶段,模型权重为随机初始化的结果,因此尚未拥有人脸识别的能力,随着人脸图像不断输入训练才逐步提升人脸识别的能力,因此需要对训练所用的余弦值放大尺度s和余弦夹角间隔m进行初始化的操作,为模型训练提供一个较强的监督信号。本专利技术中余弦值放大尺度s和余弦夹角间隔m的初始化数值是以虚线夹角中位数为,即45度作为标准。这样的初始化设定可以帮助模型在训练初期识别性能较弱的阶段进行快速收敛,且不至于因为初始设定夹角过小而难以收敛。(4)将第一批人脸图像数据集输入卷积神经网络中进行人脸类别训练,根据所述卷积神经网络中Softmax层输出的人脸图像的特征向量,计算每个人脸本文档来自技高网
...

【技术保护点】
1.一种实时更新余弦夹角损失函数参数的人脸识别方法,其特征在于,包括以下步骤:/n(1)收集人脸图像,并将人脸图像按个体进行分类,并按照分类的结果对每个人脸图像进行数据标注;/n(2)将步骤(1)收集的人脸图像进行水平翻转、去噪、亮度增强和对比度增强处理后,得到人脸图像数据集,将所述人脸图像数据集分批;/n(3)初始化余弦夹角损失函数的余弦值放大尺度和余弦夹角间隔,根据初始化的余弦值放大尺度和余弦夹角间隔,得到余弦夹角损失函数;/n(4)将第一批人脸图像数据集输入卷积神经网络中进行人脸类别训练,根据所述卷积神经网络中Softmax层的输出的人脸图像的特征向量,计算每个人脸图像的特征向量与目标类别的特征向量的夹角,并获得夹角的中位数,同时更新余弦值放大尺度;随后计算每个人脸图像的特征向量与目标类别的特征向量和非目标类别的特征向量的余弦夹角指数值之和,并获得余弦夹角指数值之和的中位数,更新余弦夹角间隔;将更新的余弦值放大尺度和余弦夹角间隔分别与初始化的余弦值放大尺度和余弦夹角间隔进行比较,选取其中较大者作为更新的结果;/n(5)分批将人脸图像数据集输入卷积神经网络中进行人脸类别训练,重复步骤(4),更新余弦值放大尺度和余弦夹角间隔,直至所述余弦夹角损失函数收敛,完成对卷积神经网络的训练;/n(6)将需要进行比对判断的人脸图像输入训练好的卷积神经网络中,经卷积神经网络中Softmax层输出人脸图像的特征向量,求出与目标图像经过本网络提取出的特征向量的余弦夹角,所述余弦夹角的相似度超过阈值时,输出人脸识别匹配正确的结果。/n...

【技术特征摘要】
1.一种实时更新余弦夹角损失函数参数的人脸识别方法,其特征在于,包括以下步骤:
(1)收集人脸图像,并将人脸图像按个体进行分类,并按照分类的结果对每个人脸图像进行数据标注;
(2)将步骤(1)收集的人脸图像进行水平翻转、去噪、亮度增强和对比度增强处理后,得到人脸图像数据集,将所述人脸图像数据集分批;
(3)初始化余弦夹角损失函数的余弦值放大尺度和余弦夹角间隔,根据初始化的余弦值放大尺度和余弦夹角间隔,得到余弦夹角损失函数;
(4)将第一批人脸图像数据集输入卷积神经网络中进行人脸类别训练,根据所述卷积神经网络中Softmax层的输出的人脸图像的特征向量,计算每个人脸图像的特征向量与目标类别的特征向量的夹角,并获得夹角的中位数,同时更新余弦值放大尺度;随后计算每个人脸图像的特征向量与目标类别的特征向量和非目标类别的特征向量的余弦夹角指数值之和,并获得余弦夹角指数值之和的中位数,更新余弦夹角间隔;将更新的余弦值放大尺度和余弦夹角间隔分别与初始化的余弦值放大尺度和余弦夹角间隔进行...

【专利技术属性】
技术研发人员:黎晨阳陆易何鹏飞徐晓刚王军
申请(专利权)人:之江实验室
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1