一种基于三级残差网络的人脸图像年龄估计方法技术

技术编号:15763714 阅读:257 留言:0更新日期:2017-07-06 02:12
一种基于三级残差网络的人脸图像年龄估计方法,属于数据处理技术领域,目的是提高非受限条件下的人脸图像年龄估计水平,其技术方案是,所述方法首先在基本残差网络框架基础上建立三级残差网络;然后采用三级残差网络对ImageNet数据集进行预训练,获得ImageNet残差网络模型;再在非受限条件下的人脸年龄数据集上对已获得的ImageNet残差网络模型进行微调训练;最后利用微调训练好的三级残差网络进行人脸图像年龄估计。本发明专利技术采用三级残差网络实现人脸图像年龄估计,不仅大大提高了DCNN网络模型的学习能力,而且很好地解决了训练过程中的过拟合以及梯度消失的问题,从而提高了非受限条件下人脸图像年龄估计的准确性。

A face image age estimation method based on three level residual network

An estimation method based on face image age three residual network, which belongs to the technical field of data processing, the purpose is to improve the face image age non constrained estimation level, the technical scheme is that the method first established three basic network in the residual network framework based on the residuals; then using three residual network pre training on the ImageNet data set, ImageNet residual network model; then face age data in the non constrained set of residual ImageNet network model has been obtained for fine-tuning training; finally using three levels of residual network trained fine face image age estimation. The invention adopts three level network residual face image age estimation, not only greatly improve the learning ability of DCNN network model, and solves the training process of over fitting and gradient disappeared, thus improving the accuracy of age estimation of face image non constrained conditions.

【技术实现步骤摘要】
一种基于三级残差网络的人脸图像年龄估计方法
本专利技术涉及一种可在非受限条件下根据人脸图像实现年龄确估计的方法,属于数据处理

技术介绍
人脸是极为丰富的信息源,人们能够从人脸图像中获得大量有用信息,如身份、性别、年龄以及表情等。作为人脸的关键信息之一,年龄在人的社会交往中起到了基础性作用,因此依靠人脸图像实现年龄的自动估计是人工智能领域的重要工作之一。目前,人脸年龄估计在基于年龄阶段的人机交互、访问控制、视觉监控、市场营销以及法律执行等多个智能领域存在良好的应用前景。人脸图像年龄估计的主要思路是从人脸图像中提取主要特征,然后采用分类或回归方法实现年龄估计,其中年龄分类用于估计人的年龄分组,年龄回归则是估计人的准确年龄。以往绝大部分人脸年龄估计方法采用人工设计的特征进行年龄估计,最初,Kwon等人通过计算人脸特征点之间的距离比例获取人脸的几何特征用于年龄估计;Cootes等人在人脸几何特征基础上加入全局纹理特征,提出了AAM模型;随后,LBP,SFP以及BIF特征分别被用来作为年龄估计的人脸特征。基于这些人工设计的特征,回归和分类方法被用于估计人脸,基于SVM的方法被用于年龄组分类,针对年龄回归,则主要包括SVR,PLS,CCA等方法。这些人工提取特征的方法在受限条件下的人脸数据集上获得了不错的结果,例如人脸年龄数据集FG-NET和MORPH。但是这些方法在非受限条件下的人脸年龄估计任务中显得差强人意,例如非受限条件下的人脸年龄数据集Adience,这些数据集中的人脸图像没有经过人工过滤和调整,图像中包含各种不同的变化,如噪音、光照,姿势,表情等,这些变化为年龄估计带来了新的挑战。目前,深度卷积神经网络(DCNN)已成为计算机视觉领域研究的热点。从5-conv+3-fc的AlexNet到16-conv+3fc的VGG网络和21-conv+1-fc的GoogleNet,再到上千层的ResNets,无论是网络的学习能力还是深度都得到显著提高。因此,近几年越来越多的学者开始尝试采用DCNN解决年龄估计问题,并证明了其在非受限条件下能够获得明显优于以往手工提取特征方法的结果。Yi等最先提出了多尺度DCNN年龄估计方法,并在MORPH上进行了验证;Wang等采用DCNN提取脸部特征,然后采用SVR进行年龄估计,在FG-NET以及MORPH上获得了较好的效果;Levi等采用DCNN在非受限条件的Adience数据集上进行年龄以及性别分类,发现非受限条件下年龄估计更具挑战;Ekmekji提出了一种链式的性别及年龄分类方法,该方法在Adience数据集上针对不同性别分别训练DCNN。以上方法所采用的DCNN均仅包含少量的卷积层和全连接层,这极大地限制了DCNN在年龄估计方面的学习能力。为了进一步提高模型的学习能力,进而提高年龄估计的准确率,Hou等采用深层类似VGG-16的网络结构以及平滑适应激活函数(SAAF)在Adience数据集上进行年龄估计,取得了较好的效果;Rothe等提出了深度期望模型(DEX),其使用VGG-16网络架构作为基础模型,采用ImageNet数据集进行预训练,继而利用IMDB-WIKI大规模数据集对网络进行微调,最后在不同的人脸数据集上进行微调训练,均得到了当前最好的结果,但在非受限条件下的Adience数据集上仍难以达到人的年龄估计水平。现有的DCNN年龄估计方法主要存在以下问题:1.现有方法在非受限条件下的年龄估计效果较差,这是由于年龄估计采用的DCNN网络学习能力不足造成的。所以需要设计学习能力更强的DCNN网络,以提高年龄估计能力。2.由于人脸数据集图像规模通常较小,采用较大的DCNN网络进行训练时,很容易造成过拟合问题,所以在模型训练时需要采用抑制过拟合的技术手段。3.较深的DCNN网络会导致梯度消失问题,梯度消失严重阻碍分类模型的学习进程,限制DCNN网络的学习能力,影响人脸图像年龄估计的准确性。
技术实现思路
本专利技术的目的在于针对现有技术之弊端,提供一种基于三级残差网络的人脸图像年龄估计方法,以提高非受限条件下人脸图像年龄估计的准确性。本专利技术所述问题是以下述技术方案解决的:一种基于三级残差深度卷积神经网络的人脸图像年龄估计方法,所述方法首先在基本残差网络框架基础上建立三级残差网络;然后采用三级残差网络对ImageNet数据集进行预训练,获得ImageNet残差网络模型;再在非受限条件下的人脸年龄数据集上对已获得的ImageNet残差网络模型进行微调训练;最后利用微调训练好的三级残差网络进行人脸图像年龄估计。三级残差网络是一种建立在残差网络基础上的新的深度卷积神经网络结构,其在原始残差网络结构基础上加入了额外两级shortcut连接。上述基于三级残差网络的人脸图像年龄估计方法,所述方法包括以下步骤:a.建立三级残差网络以基本残差网络模型(ResNets)作为基础模型,首先在所有残差块外部加入shortcut支路,称为第一级shortcut支路;然后在每个残差块组基础上加入shortcut支路,称为第二级shortcut支路;原始残差块中的shortcut支路被称为第三级shortcut支路,第一级和第二级shortcut支路均包含一个卷积层;b.采用三级残差网络对ImageNet数据集进行预训练,获得ImageNet三级残差网络预训练模型,在模型预训练过程中,采用已训练的基本残差网络模型对三级残差网络进行初始化,即原始残差块中的卷积层、BN层均由基本残差网络模型进行初始化,第一和第二级shortcut支路上的卷积层采用MSRA方法进行初始化;c.在非受限条件下的人脸年龄数据集上对已获得的ImageNet残差网络模型进行微调训练,在模型微调训练过程中采用随机深度算法,即在微调训练时随机断开一些残差映射支路,以改变信息传递路径,达到抑制过拟合以及梯度消失的目的;d.用训练好的三级残差网络进行人脸图像年龄估计。本专利技术采用三级残差网络实现人脸图像年龄估计,不仅大大提高了DCNN网络模型的学习能力,而且很好地解决了训练过程中的过拟合以及梯度消失的问题,从而提高了非受限条件下人脸图像年龄估计的准确性。附图说明图1是ResNets-34与RoR-3-34示意图;图2是随机深度残差网络示意图。文中各符号为:LBP(局部二值模式)、SFP(空间弹性特征)、BIF(生物特征)、SVR(支持向量回归)、PLS(部分最小二乘法)、CCA(典型关联分析)、shortcut(捷径支路)、epoch(一个训练循环)。具体实施方式下面结合附图对本专利技术作进一步说明。本专利技术为了解决人脸年龄估计目前存在的问题,建立了三级残差网络,并采用三级残差网络进行ImageNet数据集预训练,进而在非受限条件下的人脸年龄估计数据集上对预训练得到的模型进行微调,在微调过程中采用随机深度算法抑制过拟合问题。本专利技术包括以下3个步骤:1.首先在基本残差网络框架基础上建立三级残差网络,以提高DCNN网络模型的学习能力。2.限于人脸年龄估计数据集的规模,采用三级残差网络对ImageNet数据集进行预训练,获得ImageNet残差网络模型。3.在非受限条件下的人脸年龄数据集上对已获得的ImageNet残差网络模型进行微调训练;在本文档来自技高网
...
一种基于三级残差网络的人脸图像年龄估计方法

【技术保护点】
一种基于三级残差网络的人脸图像年龄估计方法,其特征是,所述方法首先在基本残差网络框架基础上建立三级残差网络;然后采用三级残差网络对ImageNet数据集进行预训练,获得ImageNet残差网络模型;再在非受限条件下的人脸年龄数据集上对已获得的ImageNet残差网络模型进行微调训练;最后利用微调训练好的三级残差网络进行人脸图像年龄估计。

【技术特征摘要】
1.一种基于三级残差网络的人脸图像年龄估计方法,其特征是,所述方法首先在基本残差网络框架基础上建立三级残差网络;然后采用三级残差网络对ImageNet数据集进行预训练,获得ImageNet残差网络模型;再在非受限条件下的人脸年龄数据集上对已获得的ImageNet残差网络模型进行微调训练;最后利用微调训练好的三级残差网络进行人脸图像年龄估计。2.根据权利要求1所述的一种基于三级残差网络的人脸图像年龄估计方法,其特征是,所述方法包括以下步骤:a.建立三级残差网络以基本残差网络模型(ResNets)作为基础模型,首先在所有残差块外部加入shortcut支路,称为第一级shortcut支路;然后在每个残差块组基础上加入shortcut支路,称为第二级shortcut支路;原始残差块...

【专利技术属性】
技术研发人员:张珂郭丽茹高策
申请(专利权)人:华北电力大学保定
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1