一种嵌入高阶信息的多尺度人脸年龄估计方法及系统技术方案

技术编号:26033100 阅读:43 留言:0更新日期:2020-10-23 21:11
本发明专利技术涉及人脸年龄估计领域,具体涉及一种嵌入高阶信息的多尺度人脸年龄估计方法及系统,所述方法包括:输入人脸图像,对其进行预处理;将人脸图像输入到残差网络中进行全局特征提取以构建全局支路;在全局支路的不同位置插入用于提取高阶年龄信息的块;将ResNets的第一个卷积层的输出特征图作为长短期记忆网络的输入,获取年龄敏感区域的位置信息,通过剪裁得到局部特征图以构建局部支路;通过反向传播最小化损失函数,对两条支路进行联合优化,对神经网络进行迭代训练;将测试集输入到训练好的神经网络模型中,根据年龄特征计算输出最终预测年龄。本发明专利技术的网络模型计算成本较低,精度高,相关产品的适用性较强。

【技术实现步骤摘要】
一种嵌入高阶信息的多尺度人脸年龄估计方法及系统
本专利技术属于人脸年龄估计领域,特别涉及一种嵌入高阶信息的多尺度人脸年龄估计方法及系统。
技术介绍
人脸年龄估计的目的是通过人脸图像自动输出生物年龄,广泛应用于基于年龄的人脸检索,精确广告,智能监视,人机交互(HCI),互联网访问控制等领域,是计算机视觉中的一个活跃的研究课题。由于面部衰老的内部因素(如各种基因)和面部图像的复杂变化(如不同角度的面部姿态和相机视觉)等因素的共同作用,面部衰老过程呈不可控制且个性化,从面部图像准确可靠地自动估计年龄极具挑战性。经典年龄估计算法由两个连续但相对独立的阶段组成:年龄特征提取和年龄估计。根据特征提取的方式,可将目前的人脸年龄估计方法分为两类:一是基于传统的机器学习的方法;二是基于深度学习的方法。传统机器学习方法主要是通过手动提取年龄特征,然后通过传统分类器分类,从而实现人脸年龄估计。近年来,随着深度学习技术的发展,深度神经网络在图像识别方面取得了最先进的性能,可以实现自动提取面部特征,被广泛应用于年龄估计,并取得了优于传统机器学习方法的成绩。现有技术中,深度卷积神经网络的设计主要专注于更深或是更宽的网络以增强模型的非线性建模能力,但基于深度学习的人脸年龄估计方法存在不能很好的进行兼顾全局-局部细节的人脸年龄特征表达问题,使得CNN的特征表达能力得到一定程度的限制。因此,如何实现兼顾全局和局部细节的人脸年龄估计特征表达,是未来人脸年龄估计研究方向之一。
技术实现思路
鉴于上述提到的缺乏兼顾全局-局部的特征表达能力问题,本专利技术的目的在于提供一种嵌入高阶信息的多尺度人脸年龄估计方法及系统,能够较好的进行兼顾全局-局部的年龄特征表达,并通过在网络中插入用于提取高阶年龄特征的块,进一步增强了模型的非线性建模能力,可以有效提升人脸年龄估计的准确率,实现高精度的年龄估计。在本专利技术的第一方面,本专利技术提供了一种嵌入高阶信息的多尺度年龄估计方法,包括以下步骤:一种嵌入高阶信息的多尺度人脸年龄估计方法,包括以下步骤:输入带有精确年龄标签的人脸图像集合作为数据集,并对人脸图像数据集进行预处理;将预处理后的人脸图像输入到基线模型ResNet-50中,经过卷积层和最大池化层提取出浅层特征图;在提取所述浅层特征图后连接有四组顺次相连的残差模块,并构成残差网络,将所述残差网络作为全局支路并提取出人脸图像的全局特征;在第一组残差模块和第二组残差模块之间嵌入有全局二阶池化块,从而在全局支路中生成高维的全局图像表示;将所述浅层特征图作为长短期记忆神经网络的输入,构建出局部支路并提取年龄敏感区域的局部特征;联合优化求解两条支路的交叉熵损失函数,对由全局支路和局部支路所构成的卷积神经网络进行迭代训练至收敛,保存训练好的卷积神经网络模型;将待测的人脸图像输入到训练好的卷积神经网络模型中,分类器根据年龄特征计算输出最终预测年龄。在本专利技术的第二方面,本专利技术提供了一种嵌入高阶信息的多尺度人脸年龄估计系统,包括图像获取模块、数据预处理模块、数据增强模块、神经网络模块以及输出模块;图像获取模块用于输入数据集,获取人脸图像信息或待测人脸图像;数据预处理模块用于对人脸图像信息或待测人脸图像进行人脸检测、人脸对齐、剪裁,并对人脸图像作像素归一化处理;数据增强模块用于按照随机水平翻转、缩放、旋转和平移操作对训练集进行扩展;神经网络模块用于构建并训练以全局模块和局部模块所形成的卷积神经网络;优选的,在全局模块和局部模块前还设置有共享模块,所述共享模块用于全局模块和局部模块间的转移;所述全局模块用于全局特征的提取和学习;所述局部模块用于局部特征的提取和学习;输出模块用于输出待测人脸图像的最终预测年龄。本专利技术的有益技术效果:(1)本专利技术具有速度快、精度高的效果,能够对任意输入的人脸图像进行准确的年龄估计。(2)本专利技术提出了一种新颖的兼顾全局-局部信息的多尺度特征提取架构,通过多尺度的特征提取保证了网络能够提取到不同类型(全局、局部细节)的年龄特征,增强了网络的特征表征能力,克服了现有人脸年龄估计方法中存在的缺陷。(3)本专利技术在年龄估计网络中嵌入了用以提取高阶年龄信息的GSoP块,高阶模块能沿着通道维或位置维捕获全局二阶统计信息,模型的非线性建模能力较传统的一阶网络更强。附图说明图1为本专利技术实施例提供的一种嵌入高阶信息的多尺度人脸估计方法流程图;图2为本专利技术实施例的高阶模块示意图;图3为本专利技术实施例的训练流程示意图;图4为本专利技术实施例的一种嵌入高阶信息的多尺度网络的结构示意图;图5为本专利技术实施例的一个应用效果图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的一种嵌入高阶信息的多尺度人脸年龄估计方法,如图1所示,包括:输入带有精确年龄标签的人脸图像集合作为数据集,并对人脸图像数据集进行预处理;将预处理后的人脸图像输入到基线模型ResNet-50中,经过卷积层和最大池化层提取出浅层特征图;在提取所述浅层特征图后连接有四组顺次相连的残差模块,并构成残差网络,将所述残差网络作为全局支路并提取出人脸图像的全局特征;在第一组残差模块和第二组残差模块之间嵌入有全局二阶池化块,从而在全局支路中生成高维的全局图像表示;将所述浅层特征图作为长短期记忆神经网络的输入,构建出局部支路并提取年龄敏感区域的局部特征;联合优化求解两条支路的交叉熵损失函数,对由全局支路和局部支路所构成的卷积神经网络进行迭代训练至收敛,保存训练好的卷积神经网络模型;将待测的人脸图像输入到训练好的卷积神经网络模型中,分类器根据年龄特征计算输出最终预测年龄。在一个实施例中,本专利技术所采用的数据集为MorphII人脸年龄数据集,该数据集包含从受控环境下拍摄的55134幅人脸图像,来自13618人,年龄范围为16~77岁,年龄标注类型为年龄值。为保证训练集充分性和所述测试集的合理性,本专利技术采用该数据集上广泛使用的S1-S2-S3协议进行实验,具体地,本专利技术实施例将所包含的所有步骤重复两遍,第一遍采用S1作为训练集,S2+S3作为测试集;第二遍采用S2作为训练集,S1+S3作为测试集。MorphII人脸年龄数据集提供的原始图像具有质量高、噪声小及数量多等优点,便于实验后续的处理。对MorphII数据集进行预处理:采用多任务卷积神经网络(Multi-taskCascadedConvolutionalNetworks,MTCNN)对原始采集的人脸图像进行人脸检测,通过眼睛中心、鼻尖和上唇坐标进行本文档来自技高网...

【技术保护点】
1.一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,包括以下步骤:/n输入带有精确年龄标签的人脸图像集合作为数据集,并对人脸图像数据集进行预处理;/n将预处理后的人脸图像输入到基线模型ResNet-50中,经过卷积层和最大池化层提取出浅层特征图;/n在提取所述浅层特征图后连接有四组顺次相连的残差模块,并构成残差网络,将所述残差网络作为全局支路并提取出人脸图像的全局特征;/n在第一组残差模块和第二组残差模块之间嵌入有全局二阶池化块,从而在全局支路中生成高维的全局图像表示;/n将所述浅层特征图作为长短期记忆神经网络的输入,构建出局部支路并提取年龄敏感区域的局部特征;/n联合优化求解两条支路的交叉熵损失函数,对由全局支路和局部支路所构成的卷积神经网络进行迭代训练至收敛,保存训练好的卷积神经网络模型;/n将待测的人脸图像输入到训练好的卷积神经网络模型中,分类器根据年龄特征计算输出最终预测年龄。/n

【技术特征摘要】
1.一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,包括以下步骤:
输入带有精确年龄标签的人脸图像集合作为数据集,并对人脸图像数据集进行预处理;
将预处理后的人脸图像输入到基线模型ResNet-50中,经过卷积层和最大池化层提取出浅层特征图;
在提取所述浅层特征图后连接有四组顺次相连的残差模块,并构成残差网络,将所述残差网络作为全局支路并提取出人脸图像的全局特征;
在第一组残差模块和第二组残差模块之间嵌入有全局二阶池化块,从而在全局支路中生成高维的全局图像表示;
将所述浅层特征图作为长短期记忆神经网络的输入,构建出局部支路并提取年龄敏感区域的局部特征;
联合优化求解两条支路的交叉熵损失函数,对由全局支路和局部支路所构成的卷积神经网络进行迭代训练至收敛,保存训练好的卷积神经网络模型;
将待测的人脸图像输入到训练好的卷积神经网络模型中,分类器根据年龄特征计算输出最终预测年龄。


2.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,对人脸图像数据集进行预处理包括采用多任务卷积神经网络进行人脸检测与人脸对齐,并将人脸图像剪裁到相同的尺寸,对人脸图像数据集中的候选训练集进行数据增强操作,根据下述公式对人脸图像作像素归一化:
Xpix=(Xpix-128)/128
其中,Xpix是输入的人脸图像像素值。


3.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,基线模型ResNet-50的卷积层和最大池化层的构造包括人脸图像输入到ResNet-50中,首先经过卷积核大小为7×7,步长为2的卷积层,输出特征图为112×112,再经过最大池化层,输出人脸图像的浅层特征图。


4.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,在提取出浅层特征图后,将经过人脸图像特征图依次经过四组不同的残差模块,各残差模块组依次包含数量为3,4,6,3的残差模块,每组的残差模块输出维度各不相同,输出特征图的大小依次为56×56,28×28,14×14,7×7。


5.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,全局二阶池化块的嵌入过程包括:
在残差网络中插入用于提取高阶信息的块,具体地,输入为h′×w′×c′的三维张量,将三维张量先进行1×1卷积,得到h′×w′×c的三维张量;其中h′,w′分别为输入人脸图像的长度和宽度,c′为通道数,c<c′;
计算通道的相关性,获得一个固定大小的c×c协方差矩阵,对协方差矩阵进行行方向的归一化;
执行协方差矩阵行卷积以及Sigmoid非线性激活两个连续操作,输出为c×1的权向量;
将输入张量的每个通道乘以权重向量中的相应元素,得到新的三维张量h′×w′×c,将其作为后续残差模块的输入;
在所述残差网络的最后一个残差模块末端插入矩阵归一化协方差矩阵生成人脸图像最终的全局特征表示。


6.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,基于长短期记忆神经网络构建...

【专利技术属性】
技术研发人员:钟福金王新月
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1