【技术实现步骤摘要】
一种嵌入高阶信息的多尺度人脸年龄估计方法及系统
本专利技术属于人脸年龄估计领域,特别涉及一种嵌入高阶信息的多尺度人脸年龄估计方法及系统。
技术介绍
人脸年龄估计的目的是通过人脸图像自动输出生物年龄,广泛应用于基于年龄的人脸检索,精确广告,智能监视,人机交互(HCI),互联网访问控制等领域,是计算机视觉中的一个活跃的研究课题。由于面部衰老的内部因素(如各种基因)和面部图像的复杂变化(如不同角度的面部姿态和相机视觉)等因素的共同作用,面部衰老过程呈不可控制且个性化,从面部图像准确可靠地自动估计年龄极具挑战性。经典年龄估计算法由两个连续但相对独立的阶段组成:年龄特征提取和年龄估计。根据特征提取的方式,可将目前的人脸年龄估计方法分为两类:一是基于传统的机器学习的方法;二是基于深度学习的方法。传统机器学习方法主要是通过手动提取年龄特征,然后通过传统分类器分类,从而实现人脸年龄估计。近年来,随着深度学习技术的发展,深度神经网络在图像识别方面取得了最先进的性能,可以实现自动提取面部特征,被广泛应用于年龄估计,并取得了优于传统机器学习方法的成绩。现有技术中,深度卷积神经网络的设计主要专注于更深或是更宽的网络以增强模型的非线性建模能力,但基于深度学习的人脸年龄估计方法存在不能很好的进行兼顾全局-局部细节的人脸年龄特征表达问题,使得CNN的特征表达能力得到一定程度的限制。因此,如何实现兼顾全局和局部细节的人脸年龄估计特征表达,是未来人脸年龄估计研究方向之一。
技术实现思路
鉴于上述提到的缺乏兼 ...
【技术保护点】
1.一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,包括以下步骤:/n输入带有精确年龄标签的人脸图像集合作为数据集,并对人脸图像数据集进行预处理;/n将预处理后的人脸图像输入到基线模型ResNet-50中,经过卷积层和最大池化层提取出浅层特征图;/n在提取所述浅层特征图后连接有四组顺次相连的残差模块,并构成残差网络,将所述残差网络作为全局支路并提取出人脸图像的全局特征;/n在第一组残差模块和第二组残差模块之间嵌入有全局二阶池化块,从而在全局支路中生成高维的全局图像表示;/n将所述浅层特征图作为长短期记忆神经网络的输入,构建出局部支路并提取年龄敏感区域的局部特征;/n联合优化求解两条支路的交叉熵损失函数,对由全局支路和局部支路所构成的卷积神经网络进行迭代训练至收敛,保存训练好的卷积神经网络模型;/n将待测的人脸图像输入到训练好的卷积神经网络模型中,分类器根据年龄特征计算输出最终预测年龄。/n
【技术特征摘要】
1.一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,包括以下步骤:
输入带有精确年龄标签的人脸图像集合作为数据集,并对人脸图像数据集进行预处理;
将预处理后的人脸图像输入到基线模型ResNet-50中,经过卷积层和最大池化层提取出浅层特征图;
在提取所述浅层特征图后连接有四组顺次相连的残差模块,并构成残差网络,将所述残差网络作为全局支路并提取出人脸图像的全局特征;
在第一组残差模块和第二组残差模块之间嵌入有全局二阶池化块,从而在全局支路中生成高维的全局图像表示;
将所述浅层特征图作为长短期记忆神经网络的输入,构建出局部支路并提取年龄敏感区域的局部特征;
联合优化求解两条支路的交叉熵损失函数,对由全局支路和局部支路所构成的卷积神经网络进行迭代训练至收敛,保存训练好的卷积神经网络模型;
将待测的人脸图像输入到训练好的卷积神经网络模型中,分类器根据年龄特征计算输出最终预测年龄。
2.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,对人脸图像数据集进行预处理包括采用多任务卷积神经网络进行人脸检测与人脸对齐,并将人脸图像剪裁到相同的尺寸,对人脸图像数据集中的候选训练集进行数据增强操作,根据下述公式对人脸图像作像素归一化:
Xpix=(Xpix-128)/128
其中,Xpix是输入的人脸图像像素值。
3.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,基线模型ResNet-50的卷积层和最大池化层的构造包括人脸图像输入到ResNet-50中,首先经过卷积核大小为7×7,步长为2的卷积层,输出特征图为112×112,再经过最大池化层,输出人脸图像的浅层特征图。
4.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,在提取出浅层特征图后,将经过人脸图像特征图依次经过四组不同的残差模块,各残差模块组依次包含数量为3,4,6,3的残差模块,每组的残差模块输出维度各不相同,输出特征图的大小依次为56×56,28×28,14×14,7×7。
5.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,全局二阶池化块的嵌入过程包括:
在残差网络中插入用于提取高阶信息的块,具体地,输入为h′×w′×c′的三维张量,将三维张量先进行1×1卷积,得到h′×w′×c的三维张量;其中h′,w′分别为输入人脸图像的长度和宽度,c′为通道数,c<c′;
计算通道的相关性,获得一个固定大小的c×c协方差矩阵,对协方差矩阵进行行方向的归一化;
执行协方差矩阵行卷积以及Sigmoid非线性激活两个连续操作,输出为c×1的权向量;
将输入张量的每个通道乘以权重向量中的相应元素,得到新的三维张量h′×w′×c,将其作为后续残差模块的输入;
在所述残差网络的最后一个残差模块末端插入矩阵归一化协方差矩阵生成人脸图像最终的全局特征表示。
6.根据权利要求1所述的一种嵌入高阶信息的多尺度人脸年龄估计方法,其特征在于,基于长短期记忆神经网络构建...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。