一种基于倒置残差网络的人脸年龄估计方法技术

技术编号:22565583 阅读:23 留言:0更新日期:2019-11-16 12:14
本发明专利技术公开了一种基于倒置残差网络的人脸年龄估计方法,包括以下步骤:步骤1:对人脸数据集进行人脸检测、人脸对齐等预处理;步骤2:将数据集划分为训练集和测试集;步骤3:对训练集进行数据增强操作,作为训练样本的输入;步骤4:建立一个基于倒置残差的网络模型;步骤5:将数据增强后的训练样本作为模型的输入,利用反向传播最小化损失函数,训练得到最终的基于倒置残差网络的目标训练模型;步骤6:用测试集测试步骤5得到的目标训练模型,得出被测人脸图像的年龄估计。本发明专利技术摒弃了传统深度学习网络模型,采用了基于倒置残差的网络模型进行人脸年龄估计,在不降低年龄估计精度的前提下,大大减少了网络模型的参数,显著提高了其性能。

A face age estimation method based on inverted residual network

The invention discloses a face age estimation method based on the inverted residual network, which comprises the following steps: Step 1: preprocessing the face data set for face detection, face alignment, etc.; step 2: dividing the data set into training set and test set; step 3: performing data enhancement operation on the training set as the input of the training sample; step 4: establishing a face age estimation method based on the inverted residual network Step 5: take the data enhanced training samples as the input of the model, use the back propagation minimization loss function to train the final target training model based on the inverted residual network; step 6: use the target training model obtained in step 5 of the test set test to get the age estimation of the tested face image. The invention abandons the traditional deep learning network model and adopts the network model based on the inverted residual to estimate the age of the face. Without reducing the accuracy of the age estimation, the parameters of the network model are greatly reduced and the performance is significantly improved.

【技术实现步骤摘要】
一种基于倒置残差网络的人脸年龄估计方法
本专利技术涉及图像识别和深度学习
,尤其涉及一种基于倒置残差网络的人脸年龄估计方法。
技术介绍
人脸图像包含很多信息,如身份、表情、姿态、性别和年龄,其中年龄是人的重要生物特征,可以应用于多种场景:如基于年龄的人机交互系统,根据用户的不同年龄,提供不同的人机交互界面,更好地为用户服务;基于年龄的访问控制,如禁止未成年人访问色情网站、购买烟酒等;电子商务中的个性营销,针对不同年龄段的用户采用不同的营销手段。目前的人脸年龄分类方法主要有两类:一是基于传统的机器学习的方法;二是基于深度学习的方法。近年来,随着深度学习的不断发展,很多研究者将其运用到计算机视觉领域并取得了很好的结果。随着网络结构的不断改进和优化,使其运用领域不断扩大,其中包括人脸年龄分类场景。传统机器学习方法主要是通过人工设计算子提取人脸特征,然后通过分类器分类,从而实现人脸年龄估计。这种方法主要的问题在于人工设计算子具有局限性、鲁棒性较差,导致年龄估计精度较低。基于卷积神经网络的人脸年龄估计问题主要是随着网络的加深出现了梯度爆炸和梯度消失,传统的解决方法是初始化和正则化,但该方法又出现了网络性能退化问题。基于残差网络的人脸年龄估计方法能够很好地解决退化问题,使得网络性能提升,可仍然存在网络模型复杂导致网络参数过多,模型的实时性较差,过度依赖设备,在移动端效果较差的问题。而本专利技术能够解决上面问题。
技术实现思路
专利技术目的:为了解决现有技术存在的问题,本专利技术的目的是提供一种基于倒置残差网络的人脸年龄估计方法,以有效解决模型训练过程中的梯度消失问题,同时丰富特征的表征能力,从而提升模型预估精度。技术方案:一种基于倒置残差网络的人脸年龄估计方法,包括以下步骤:步骤1:人脸图像数据集预处理;主要包括:采用MTCNN网络进行人脸检测与人脸对齐,并将人脸图像缩放到相同尺寸。步骤2:将步骤1得到的数据集按比例划分为候选训练集与测试集;步骤3:对候选训练集图像进行数据增强操作;主要包括:将每一幅图像随机裁剪出多张相同尺寸的图像,并将裁剪出的图像进行随机翻转、改变亮度值和对比度,数据增强后的图像构成训练集。步骤4:建立一个基于倒置残差的人脸年龄估计网络模型,具体包括如下内容:步骤4-1:建立一个卷积层,卷积层后连接激活函数,优选的采用修正线性单元ReLU:f(z)=max(0,z)其中,z是ReLU的输入;步骤4-2:在步骤4-1后连接一个池化层;步骤4-3:在步骤4-2后级联多个倒置残差模块,模块的输入通道数为M,输出通道数为N,级联模块的数量在4-12之间,通过训练级联不同数目倒置残差模块的网络模型,选择出最优的模块级联数量;建立所述倒置残差模块的步骤如下:步骤4-3-1:将通道数为M的输入特征图先进行1x1卷积,其中引入一个t>1的扩展因子,使得特征图的通道数扩展为tM,1x1卷积后连接一个如步骤4-1所述的激活函数ReLU;步骤4-3-2:将4-3-1输出的特征图进行卷积核大小为3x3的深度可分离卷积,深度可分离卷积由一个核大小为3x3、通道为1的深度卷积和一个核大小为1x1,通道数为tM的点卷积构成,输出一个通道数为N的特征图。之后连接一个如步骤4-1所述的激活函数ReLU;步骤4-3-3:将步骤4-3-1中输入的特征图与步骤4-3-2输出的特征图相加,如下公式所示:y=F(x,{wi})+x其中,x表示反向残差块的输入特征向量,y表示反向残差块的输出特征向量,F(x,{wi})表示学习到的残差特征,wi表示可学习参数,i表示经过的网络层数。步骤4-4:在步骤4-3后连接1个全连接层;步骤4-5:在步骤4-4后连接输出层;所述输出层的维度为K,输出层采用softmax函数生成年龄1至K对应的预测概率,sofxmax函数定义为:其中,j表示预测年龄,1≤j≤K,K表示可预测的年龄最大值,pj表示预测年龄为j的概率,y表示步骤4-4的输出向量,wk和wj表示分类器的可学习参数,T表示转置;步骤5:将经过步骤3处理后的训练集输入到步骤4建立的网络进行训练,利用反向求导更新模型参数,从而最小化损失函数值;具体包括如下内容:步骤5-1:随机初始化模型参数,设定训练轮次;步骤5-2:将训练样本输入到人脸年龄估计网络模型中学习,更新模型参数,计算损失函数值,当损失值趋于稳定,则满足收敛条件,执行步骤5-3,否则继续执行步骤5-2;步骤5-3:如果满足收敛条件但未达到所设定的训练轮次,则提前终止网络的训练,执行步骤5-4;否则直接执行步骤5-4;步骤5-4:得到训练模型。步骤6:采用步骤2的测试集评估步骤5得到的训练模型,得出样本的年龄估计。进一步的,步骤5-2中,所述损失函数表示如下:Loss=-∑jp′jlog(pj)其中,Loss为损失值,p′j为训练集中样本图像标签年龄为j的概率,其值为0或1。进一步的,当两次损失值之差小于0.01时,满足收敛条件。和现有技术相比,本专利技术摒弃了传统深度学习网络模型,采用了基于倒置残差的网络模型进行人脸年龄估计,能够显著减少网络的参数,增加网络的非线性,提升特征提取能力。本专利技术通过残差模块将新特征和原特征融合,使得新特征中包含原特征信息,可以有效解决模型训练过程中的梯度消失问题,同时丰富特征的表征能力,从而提升模型预估精度。本专利技术在人脸年龄估计任务中,显著提高精度和速度,能够较好的运用到实际场景中。附图说明图1为本专利技术的一种基于倒置残差网络的人脸年龄估计方法的流程图;图2为本专利技术实施例的图像裁剪示例图;图3为本专利技术实施例的倒置残差模块框图。具体实施方式下面结合附图和具体实施例对本专利技术的技术方案作进一步说明。以下实施例仅用于更加清楚地说明本专利技术的技术方案,而不能以此来限制本专利技术的保护范围。如图1所示,本专利技术的一种基于倒置残差网络的人脸年龄估计方法,包括如下步骤:首先对输入的人脸图像进行预处理,将数据集划分为训练集和测试集后,对训练集做数据增强操作,以提高模型的泛化能力,然后构建基于倒置残差的网络模型,缩减模型大小且提高模型精度,再进行网络模型的训练,保存模型用于年龄估计,最后用测试集评估模型性能,得出样本人脸年龄估计。步骤1:针对输入的人脸图像,进行人脸图像数据集预处理,主要操作包括:采用MTCNN(多任务级联卷积神经网络)网络进行人脸检测与人脸对齐,并将人脸图像缩放到相同尺寸。本实施例中,将人脸图像统一缩放到256x256。步骤2:将步骤1得到的数据集按比例划分为候选训练集与测试集。本实施例中取10000张带有正确年龄标签的人脸图像作为数据集。为保证训练集充分性和所述测试集的合理性,本实施例将训练集与测试集的图像数量按4:1的比例进行划分。...

【技术保护点】
1.一种基于倒置残差网络的人脸年龄估计方法,其特征在于,包括以下步骤:/n步骤1:人脸图像数据集预处理;/n步骤2:将步骤1得到的数据集按比例划分为候选训练集与测试集;/n步骤3:对候选训练集图像进行数据增强操作;/n步骤4:建立一个基于倒置残差的人脸年龄估计网络模型,具体包括如下内容:/n步骤4-1:建立一个卷积层,卷积层后连接激活函数;/n步骤4-2:在步骤4-1后连接一个池化层;/n步骤4-3:在步骤4-2后级联多个倒置残差模块,模块的输入通道数为M,输出通道数为N,级联模块的数量在4-12之间,通过训练级联不同数目倒置残差模块的网络模型,选择出最优的模块级联数量;/n步骤4-4:在步骤4-3后连接1个全连接层;/n步骤4-5:在步骤4-4后连接输出层;所述输出层的维度为K,输出层采用softmax函数生成年龄1至K对应的预测概率,sofxmax函数定义为:/n

【技术特征摘要】
1.一种基于倒置残差网络的人脸年龄估计方法,其特征在于,包括以下步骤:
步骤1:人脸图像数据集预处理;
步骤2:将步骤1得到的数据集按比例划分为候选训练集与测试集;
步骤3:对候选训练集图像进行数据增强操作;
步骤4:建立一个基于倒置残差的人脸年龄估计网络模型,具体包括如下内容:
步骤4-1:建立一个卷积层,卷积层后连接激活函数;
步骤4-2:在步骤4-1后连接一个池化层;
步骤4-3:在步骤4-2后级联多个倒置残差模块,模块的输入通道数为M,输出通道数为N,级联模块的数量在4-12之间,通过训练级联不同数目倒置残差模块的网络模型,选择出最优的模块级联数量;
步骤4-4:在步骤4-3后连接1个全连接层;
步骤4-5:在步骤4-4后连接输出层;所述输出层的维度为K,输出层采用softmax函数生成年龄1至K对应的预测概率,sofxmax函数定义为:



其中,j表示预测年龄,1≤j≤K,K表示可预测的年龄最大值,pj表示预测年龄为j的概率,y表示步骤4-4的输出向量,wk和wj表示分类器的可学习参数,T表示转置;
步骤5:将经过步骤3处理后的训练集输入到步骤4建立的网络进行训练,利用反向求导更新模型参数,从而最小化损失函数值;
步骤6:采用步骤2的测试集评估步骤5得到的训练模型,得出样本的年龄估计。


2.根据权利要求1所述的基于倒置残差网络的人脸年龄估计方法,其特征在于,步骤1中,所述预处理包括:采用MTCNN网络进行人脸检测与人脸对齐,并将人脸图像缩放到相同尺寸。


3.根据权利要求1所述的基于倒置残差网络的人脸年龄估计方法,其特征在于,步骤3中,所述数据增强操作包括:将每一幅图像随机裁剪出多张相同尺寸的图像,并将裁剪出的图像进行随机翻转、改变亮度值和对比度,数据增...

【专利技术属性】
技术研发人员:宋建新曹穆赟
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1