一种基于人脸特征学习的轻量级多头年龄估计方法技术

技术编号:29791515 阅读:13 留言:0更新日期:2021-08-24 18:10
本发明专利技术公开了一种基于人脸特征学习的轻量级多头年龄估计方法,向构建的多头人脸年龄估计模型中输入预处理后的待测人脸图片,构建的多头人脸年龄估计模型预测输出人脸年龄。构建多头人脸年龄估计模型,包括:预处理人脸图片训练数据集;以经过通道压缩的SSR‑NET特征提取网络作为双支路多头的年龄估计主干网络,在年龄估计主干网络后接上多头网络;对人脸图片训练数据集利用多头网络进行多次二分类任务和一次回归任务的训练;利用损失函数引导人脸年龄估计网络学习包括二元交叉熵损失和Smooth‑L1损失的最佳参数,使用预处理后的训练集训练多头的年龄估计主干网络,获得最佳多头人脸年龄估计模型。

【技术实现步骤摘要】
一种基于人脸特征学习的轻量级多头年龄估计方法
本专利技术涉及一种基于人脸特征学习的轻量级多头年龄估计方法,属于计算机视觉

技术介绍
随着科学技术的不断发展,人们越来越追求安全、便捷、舒适的生活,例如人们在享受汽车带来便捷出行同时,也更多的关注行车安全问题。因此,如何改善驾驶安全,保障人身安全是目前汽车研究领域一个重要课题。近些年随着辅助驾驶系统(ADAS)和驾驶员监控系统(DMS)的出现,在一定程度上保障了驾驶的安全性。驾驶员监控系统利用传感器与算法的融合达到对驾驶员属性、状态的实时监控,提高驾驶的安全性。人脸年龄估计任务作为驾驶员监控系统中一个重要的基础任务,实现高效、准确、稳定的人脸年龄估计算法必定能够在驾驶员监控系统中发挥重大作用。现有技术中,卷积神经网络在分类任务上取得了较大的提升,其准确率已远高于非深度学习方法。虽然卷积神经网络从早期的浅层神经网络不断发展到目前各种复杂结构,在各大计算机视觉任务中已取得巨大的成功,但庞大的网络很难在实际的算力资源有效地在嵌入式平台上使用,并且目前的年龄估计网络大多单独使用分类或者回归的方法来做年龄估计的任务,在精度上还有很大的提高空间。因此,如何能够将当前优异的深度学习网络模型适配到人脸年龄估计任务中,并且部署到实际应用场景中是目前丞待解决的重要问题。
技术实现思路
本专利技术所要解决的技术问题是克服现有技术的缺陷,提供一种基于人脸特征学习的轻量级多头年龄估计方法。为达到上述目的,本专利技术提供一种基于人脸特征学习的轻量级多头年龄估计方法,包括:向构建的多头人脸年龄估计模型中输入预处理后的待测人脸图片,构建的多头人脸年龄估计模型预测输出人脸年龄。优先地,构建多头人脸年龄估计模型,包括:预处理人脸图片训练数据集,将人脸图片训练数据集按比例分为训练集、验证集和测试集;以经过通道压缩的SSR-NET特征提取网络作为双支路多头的年龄估计主干网络,在年龄估计主干网络后接上多头网络;对人脸图片训练数据集利用多头网络进行多次二分类任务和一次回归任务的训练;利用损失函数引导人脸年龄估计网络学习包括二元交叉熵损失和Smooth-L1损失的最佳参数,使用预处理后的训练集训练多头的年龄估计主干网络,获得最佳多头人脸年龄估计模型;利用测试集测试多头人脸年龄估计模型,若多头人脸年龄估计模型不满足设定的要求,则调整模型参数,使用预处理后的训练集训练多头的年龄估计主干网络,获得多头人脸年龄估计模型。优先地,人脸图片训练数据集和待测人脸图片均包括多个年龄段的训练人脸图片,训练人脸图片和待测人脸图片均为由车载摄像头采集并经过抠取提取人脸得到的人脸图片,预处理训练人脸图片和预处理待测人脸图片包括:对人脸图片进行真实年龄的标注,年龄标注数值有M个;从人脸图片训练数据集中随机次序批量读取人脸图片;对人脸图片进行数据增强;对人脸图片进行年龄标签处理。优先地,年龄标签处理,包括:对人脸图片标记用于回归的原始标签,原始标签为人脸图片对应的实际年龄;对人脸图片标记用于分类的One-hot年龄编码标签,One-hot年龄编码标签将实际年龄编码成M维,M维由0、1两元素组成的向量。优先地,对人脸图片训练数据集利用多头网络进行多次二分类任务和一次回归任务的训练,包括:二分类分支处理二分类任务,回归分支处理一次回归任务,利用回归分支引导多个二分类分支学习更加稳定的年龄估计主干网络,二分类分支计算期望值作为实际预测年龄;二分类分支计算期望值作为实际预测年龄,包括:将年龄间隔为[1,M]的年龄估计任务均匀划分为M-1个区间,每个区间宽度μi为1,对于给定的人脸图片和One-hot年龄编码标签,将One-hot年龄编码标签转换为One-hot编码,使用二元交叉熵作为损失函数进行网络反向传播;多头网络输出预测分布向量预测分布向量表示人脸图片属于每个年龄区间的概率;利用公式(1)计算期望值,预测实际年龄y:其中,μi代表区间宽度,pi代表网络预测分布向量。优先地,数据增强包括通道处理和几何操作;其中,通道处理使用灰度化方法,将原本三通道的RGB人脸图片通过通道像素值加权的方法转换成单通道;几何操作包括缩放、随机裁剪和水平翻转,最终输出固定尺寸的人脸图片。优先地,利用损失函数引导人脸年龄估计网络学习包括二元交叉熵损失和Smooth-L1损失的最佳参数,包括:总的损失函数如公式(2)所示:L=λclsLcls+λregLreg(2)其中,Lcls为二元交叉熵损失,Lreg为Smooth-L1损失;λcls和λreg为损失权衡系数,λcls和λreg设置为1;损失函数值L越小,人脸年龄估计网络拟合效果越好;Lcls计算公式为:其中,训练集分为多个批次,N表示每个批次有N个人脸图片,i表示第i个人脸图片,p(x)为One-hot数据标签的真实分布;q(x)为二分类支路预测分布;Lreg计算公式为:其中,x为回归分支的输出。优先地,使用预处理后的训练集训练年龄估计主干网络,获得多头人脸年龄估计模型,包括:模型参数包括批处理大小、初始学习率和轮次,将训练集中的人脸图片输入年龄估计主干网络中,令批处理大小为256,初始学习率为0.0005,训练90个轮次,学习率每30个轮次衰减为原来的0.1倍,基于损失函数依次获得多个训练集的损失函数值L;选择Adam为模型优化器,令权重衰减率为0.0001;将验证集中的人脸图片输入年龄估计主干网络中,基于损失函数依次获得多个验证集的损失函数值L;将损失函数值L作为Y轴,将得到损失函数值L的顺序作为X轴,分别获得训练集的损失值曲线图和验证集的损失值曲线图,训练集的损失值曲线图在下降后趋于平稳,且验证集的损失值曲线图与训练集的损失值曲线图相趋近且不再下降时,得到最优的多支路多头人脸年龄估计模型。优先地,利用测试集测试多头人脸年龄估计模型,若多头人脸年龄估计模型不满足设定的要求,则调整模型参数,重新使用预处理后的训练集训练多头的年龄估计主干网络,获得多头人脸年龄估计模型,包括:将训练集训练的模型参数加载到多支路多头人脸年龄估计模型中;将测试集中的人脸图片输入多支路多头人脸年龄估计模型中,预测测试集中人脸图片中人脸的年龄,基于损失函数依次获得多个测试集的损失函数值;对预测的年龄进行评估,若预测的年龄与真实年龄相差超过10%-50%,则微调包括轮次、批量大小和学习率的模型参数;微调包括轮次、批量大小和学习率的模型参数,包括:如果测试集的损失值曲线图处于下降趋势则认为是欠拟合,此时增大轮次;如果测试集的损失值曲线图处于下降趋势,且验证集的损失值曲线图处于上升趋势,则认为是过拟合,此时降低轮次;每次微调包括轮次、批量大小和学习率的模型参数时,批量大小增大32的倍数,学本文档来自技高网...

【技术保护点】
1.一种基于人脸特征学习的轻量级多头年龄估计方法,其特征在于,包括:/n向构建的多头人脸年龄估计模型中输入预处理后的待测人脸图片,构建的多头人脸年龄估计模型预测输出人脸年龄。/n

【技术特征摘要】
1.一种基于人脸特征学习的轻量级多头年龄估计方法,其特征在于,包括:
向构建的多头人脸年龄估计模型中输入预处理后的待测人脸图片,构建的多头人脸年龄估计模型预测输出人脸年龄。


2.根据权利要求1所述的一种基于人脸特征学习的轻量级多头年龄估计方法,其特征在于,构建多头人脸年龄估计模型,包括:
预处理人脸图片训练数据集,将人脸图片训练数据集按比例分为训练集、验证集和测试集;
以经过通道压缩的SSR-NET特征提取网络作为双支路多头的年龄估计主干网络,在年龄估计主干网络后接上多头网络;
对人脸图片训练数据集利用多头网络进行多次二分类任务和一次回归任务的训练;
利用损失函数引导人脸年龄估计网络学习包括二元交叉熵损失和Smooth-L1损失的最佳参数,使用预处理后的训练集训练多头的年龄估计主干网络,获得最佳多头人脸年龄估计模型;利用测试集测试多头人脸年龄估计模型,若多头人脸年龄估计模型不满足设定的要求,则调整模型参数,使用预处理后的训练集训练多头的年龄估计主干网络,获得多头人脸年龄估计模型。


3.根据权利要求2所述的一种基于人脸特征学习的轻量级多头年龄估计方法,其特征在于,
人脸图片训练数据集和待测人脸图片均包括多个年龄段的训练人脸图片,训练人脸图片和待测人脸图片均为由车载摄像头采集并经过抠取提取人脸得到的人脸图片,预处理训练人脸图片和预处理待测人脸图片包括:
对人脸图片进行真实年龄的标注,年龄标注数值有M个;
从人脸图片训练数据集中随机次序批量读取人脸图片;
对人脸图片进行数据增强;
对人脸图片进行年龄标签处理。


4.根据权利要求3所述的一种基于人脸特征学习的轻量级多头年龄估计方法,其特征在于,
年龄标签处理,包括:
对人脸图片标记用于回归的原始标签,原始标签为人脸图片对应的实际年龄;对人脸图片标记用于分类的One-hot年龄编码标签,One-hot年龄编码标签将实际年龄编码成M维,M维由0、1两元素组成的向量。


5.根据权利要求2所述的一种基于人脸特征学习的轻量级多头年龄估计方法,其特征在于,对人脸图片训练数据集利用多头网络进行多次二分类任务和一次回归任务的训练,包括:
二分类分支处理二分类任务,回归分支处理一次回归任务,利用回归分支引导多个二分类分支学习更加稳定的年龄估计主干网络,二分类分支计算期望值作为实际预测年龄;
二分类分支计算期望值作为实际预测年龄,包括:
将年龄间隔为[1,M]的年龄估计任务均匀划分为M-1个区间,每个区间宽度μi为1,对于给定的人脸图片和One-hot年龄编码标签,将One-hot年龄编码标签转换为One-hot编码,使用二元交叉熵作为损失函数进行网络反向传播;
多头网络输出预测分布向量预测分布向量表示人脸图片属于每个年龄区间的概率;
利用公式(1)计算期望值,预测实际年龄y:



其中,μi代表区间宽度,pi代表网络预测分布向量。


6.根据权利要求3所述的一种基于人脸特征学习的轻量级多头年龄估计方法,其特征在于,
数据增强包括通道处理和几何操作;
其中,通道处理使用灰度化方法,将原本三通道的RGB人脸图片通过通道像素值加权的方法转换成单通道;几何操作包括缩放、随机裁剪和水平翻转,最终输出固定尺寸的人脸图片。


7.根据权利要求3所述的一种基于人脸特征学习的轻量级多头年龄估计方法,其特征在于,利用损失函数引导人脸年龄估计网络学习包括二元交叉熵损失和Smooth-L1损失的最佳参数,包括:
总的损失函数如公式(2)所示:
L=λclsLcls+λregLreg(2)
其中,Lcls为二元交叉熵损失,Lreg为Smooth-L1损失;λcls和λreg...

【专利技术属性】
技术研发人员:周翔刘国清倪一华
申请(专利权)人:南京佑驾科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1