构建及训练人脸识别特征提取网络的方法技术

技术编号:14525033 阅读:54 留言:0更新日期:2017-02-02 03:34
本发明专利技术提供了一种构建及训练人脸识别特征提取网络的方法,其中,该方法包括:构建特征提取网络和度量学习降维网络,其中,所述特征提取网络的输出为所述度量学习降维网络的输入;基于全部样本集训练所述特征提取网络从而输出特征集;利用语义采样筛选所述特征集从而获得纯净样本集;基于所述纯净样本集训练所述度量学习降维网络。通过本发明专利技术构建的自然人脸识别网络可以提高特征的表征能力,从而充分挖掘数据中的特征信息,可以准确识别原始人脸图片。

【技术实现步骤摘要】

本专利技术涉及图像识别
,尤其涉及一种人脸识别网络的构建方法,具体来说就是一种构建及训练人脸识别特征提取网络的方法。
技术介绍
人脸识别一直以来都是计算机视觉中的热点话题。与传统的虹膜识别、指纹识别等生物特征识别相比,人脸识别不需要借助特殊的媒介采集数据,只通过最为普通的摄像头获取的影像数据或图片即可完成识别任务。这使得人脸识别比虹膜识别、指纹识别等具有更为广泛的应用场景。人脸识别作为生物特征识别的一种,多被应用于安防、身份认证等领域。随着社会的不断发展及科学技术的不断进步,人脸识别技术已经慢慢地从实验室研究走入了人们的生活。进而人脸识别被应用在门禁、考勤、手机解锁、金融支付等更加贴近日常生活的领域。但是,人脸识别技术应用在日常生活场景中,也存在一个不可回避的问题,就是人脸识别设备无法获取到类似于实验室采集的标准光照、标准姿态的照片。在日常人脸识别场景中,人们很可能是在自然状态下通过手机摄像头采集照片,这导致这些待识别数据也趋近于自然、任意、多光照、多表情的人脸图片。这些数据与之前实验室获取的标准光照、标准姿态的人脸数据相比,自然生活状态下的人脸含有较多的噪声,在识别过程中需要考虑不均衡光照,非正面姿态、表情以及人物是否有面部小范围遮挡,是否化妆等因素,使得传统的人脸识别技术受到了巨大的挑战。因此,如何研发出一种对外在干扰因素鲁棒的人脸识别技术是当前亟待解决的一个问题。现有技术中,获得一个具有鲁棒性的人脸识别模型,依赖庞大的训练数据。希望训练数据与实际预测数据具有相似的统计分布。目前,随着互联网的发展,以及社交网络的普及,在当前大数据时代,人们可以通过互联网获取庞大的训练数据。但如何利用这些庞大的训练数据,使得人脸识别模型充分学习到所需要的信息成为当下研究的热点。随着深度学习的流行与发展,人们发现深度学习与浅层学习相比,深度学习能更好的描述数据中隐含的信息,并且比浅层学习具有更好的表征能力及对目标函数的拟合能力。因此,在自然图像识别领域,深度学习取得了突出的贡献。然而人脸识别与自然图像识别是两个不同的任务,具有相似性也具有不同的特点。相似点表现为二者都是图像识别任务,参考信号以及损失函数相似,都是利用深度学习网络高度抽象及表征拟合能力处理庞大的数据;不同点在于自然图像千差万别,背景复杂庞大,网络可能需要更多的考虑大范围上下文信息及颜色纹理信息,而人脸结构简单,不同人的区分度与自然图像中不同类别的区分度相比,不同人之间的区分度更小,在人脸识别任务中需要更多的关注细节差异,较少的关注颜色信息。故而不能直接的将自然图像识别的训练方式及网络结构直接应用在人脸识别任务中。现有常见的自然人脸识别深度神经网络,例如CASIA-NET,其训练数据全部采集自互联网,并且去除了与LFW数据库中重叠的人物身份,保证了训练集与测试集不重叠。CASIA-Net共包含10个卷积层,一个全连接分类层,如图7所示,具体参数如下表a,表a为CASIA-Net的网络参数,从表a中可以看出,CASIA-Net融合了现有比较成功的神经网络设计技巧,包括深层结构、低维表示、多损失函数。较小的卷积核堆叠不仅可以降低参数的数量,还可以增加网络的非线性能力,CASIA-Net中全部用的是3*3卷积的堆叠。受现有VGG-Net的启发,CASIA-Net将两个3*3组成一个stage,共5个stage组成整个网络。CASIA-Net并没有采用全连层来融合特征图像(featuremap)来得到低维的特征,整个网络特征提取都用的是卷积操作。池化5(Pool5)层是特征层,低维表示符合人脸低维流行分布的假设。由于低维表示需要包含人脸的所有区分信息,而ReLU会使得神经元稀疏,故而卷积52(Conv52)并没有采用ReLU激活。在最大池化(maxpooling)中,是取感知域最大值作为激活值传入下一层,在特征层中若采用maxpooling,很容易引入噪声敏感区域。故在conv52层后采用averagepooling操作,在特征层融合softmax信号和verification信号学习到了更多的有利于区分人脸的表示信息。表a众所周知,人脸与自然图像不同,人脸结构单一且固定。对于人脸分类的网络,不仅需要大尺度特征,也需要更多的关注图像的细节特征,即需要更小的卷积核,更小的感知域来捕获细节。但是,现有CASIA-Net的卷积层堆叠简单,对网络提取的特征也没有深入研究,卷积核均采用3*3,特征尺度单一,因此现有CASIA-Net无法胜任自然人脸特征识别。为了进一步改善现有的自然人脸识别深度神经网络,人们试图引入其它学习思想,以使自然人脸识别深度神经网络的参数达到一个较优的位置,例如,度量学习的引入可以改善自然人脸识别深度神经网络的特性。度量学习的典型损失函数为tripletloss。但tripletloss在神经网络训练中存在几个问题:一是硬件资源不足,二是不能良好的和softmax统一训练,三是在特征空间提供误差对噪声不鲁棒。因此,现有自然人脸识别深度神经网络依然无法准确识别自然人脸,因而,如何改进现有的人脸识别深度神经网络来准确识别自然人脸图片成为了本领域技术人员亟待解决的技术问题。
技术实现思路
有鉴于此,本专利技术要解决的技术问题在于提供一种构建及训练人脸识别特征提取网络的方法,解决了现有深度学习网络的不能精确提取有效特征,以及不能准确识别原始人脸图片的问题。为了解决上述技术问题,本专利技术的具体实施方式提供一种构建及训练人脸识别特征提取网络的方法,包括:构建特征提取网络和度量学习降维网络,其中,所述特征提取网络的输出为所述度量学习降维网络的输入;基于全部样本集训练所述特征提取网络从而输出特征集;利用语义采样筛选所述特征集从而获得纯净样本集;基于所述纯净样本集训练所述度量学习降维网络。根据本专利技术的上述具体实施方式可知,构建及训练人脸识别特征提取网络的方法至少具有以下有益效果:同时利用特征提取网络和度量学习降维网络进行特征提取。在特征提取网络中,设计了以阶段(Stage)堆叠方式的深度学习网络,从而让深度学习网络具有更好的特征提取能力;在Stage的设计中,同时采用了1*1、3*3、5*5的卷积核,并同时对前一层的特征图像(featuremap)卷积,并将得到的featuremap叠加,以此来提取多尺度的特征;然后,采用了一个3*3的卷积核对多尺度的featuremap进行卷积,将多尺度卷积核的特征融合起来,并且,通过featuremap维度的变化,达到了先扩张,充分学习较完备的特征,再压缩,去除冗余特征的目的;每一个Stage都可以看作是卷积核的叠加,卷积核的叠加可以看作利用较少的权重得到较大的感知域,并且增强了深度学习网络的非线性表征层。另外,引入度量学习降维网络,度量学习降维网络的输入为特征提取网络提取到的图像的较低维特征,特征提取网络的输出特征集通过语义采样,筛选出纯净样本集;再利用纯净样本集训练度量学习降维网络;然后利用度量学习损失函数tripletloss优化度量学习降维网络,同时利用特征提取网络和度量学习降维网络进行特征提取,提高特征的表征能力,从而充分挖掘数据中的特征信息,指导深度学习网络快速求解,可以准确识别原始人脸图片。应了解的是,上述本文档来自技高网
...

【技术保护点】
一种构建及训练人脸识别特征提取网络的方法,其特征在于,该方法包括:构建特征提取网络和度量学习降维网络,其中,所述特征提取网络的输出为所述度量学习降维网络的输入;基于全部样本集训练所述特征提取网络从而输出特征集;利用语义采样筛选所述特征集从而获得纯净样本集;以及基于所述纯净样本集训练所述度量学习降维网络。

【技术特征摘要】
1.一种构建及训练人脸识别特征提取网络的方法,其特征在于,该方法包括:构建特征提取网络和度量学习降维网络,其中,所述特征提取网络的输出为所述度量学习降维网络的输入;基于全部样本集训练所述特征提取网络从而输出特征集;利用语义采样筛选所述特征集从而获得纯净样本集;以及基于所述纯净样本集训练所述度量学习降维网络。2.如权利要求1所述的构建及训练人脸识别特征提取网络的方法,其特征在于,基于所述纯净样本集训练所述度量学习降维网络的步骤之后,该方法还包括:利用度量学习损失函数tripletLoss优化所述度量学习降维网络。3.如权利要求2所述的构建及训练人脸识别特征提取网络的方法,其特征在于,所述度量学习损失函数tripletLoss的具体公式为:tripletloss=log(1+z)其中,z为中间变量;fa为选定样本a的特征;fp为选定样本p的特征;fn为选定样本n的特征;margin为预设的固定间隔。4.如权利要求2所述的构建及训练人脸识别特征提取网络的方法,其特征在于,利用度量学习损失函数tripletLoss优化所述度量学习降维网络时,以远离大多数样本点的样本点为锚点从而使远离大多数样本点...

【专利技术属性】
技术研发人员:吴晓雨郭天楚杨磊朱贝贝谭笑
申请(专利权)人:中国传媒大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1