一种年龄识别的神经网络结构及其训练方法技术

技术编号:38617654 阅读:13 留言:0更新日期:2023-08-26 23:45
本发明专利技术公开了一种年龄识别的神经网络结构及其训练方法。所述结构包括:主干网络,该主干网络用于提取图片中的年龄特征信息;分类预测头,该分类预测头与主干网络相连,用于通过年龄特征信息判别年龄段;排序预测头,该排序预测头与主干网络相连,用于根据年龄段预测每个年龄的概率累积和,并根据概率累积和进行排序。本发明专利技术提出一个先分年龄段分类,后进行年龄等级排序的预测模型,以提高模型的回归精度,网络分为基础主干网络、分类预测头和排序预测头组成。分类预测头能够很精确的区分不同年龄段并且有助于后续精细分类。本发明专利技术能够有效的保证人脸年龄预测的精度,较强的泛化能力,可以应用于各种场景的人脸,并且模型轻量且速度快。且速度快。且速度快。

【技术实现步骤摘要】
一种年龄识别的神经网络结构及其训练方法


[0001]本专利技术涉及年龄预测
,尤其涉及一种年龄识别的神经网络结构及其训练方法。

技术介绍

[0002]人脸年龄检测算法是一种基于人脸图像的算法,旨在通过对人脸图像进行分析和处理,预测人脸主人的年龄。年龄是对于人脸进行分类的重要属性,准确与否对下游算法至关重要。主要可以分为基于传统机器学习方法和深度学习方法两种。传统算法由于手工提取的特征不一定能够很好地表达人脸图像的特征,因此预测准确率较低,不如深度学习。现有深度学习算法的问题主要是算法的复杂度高,速度较慢,过拟合较为严重以及预测偏差较大。
[0003]请参阅图1,常规的人脸年龄预测模型主要有主干和预测头组成,如图1所示。对于常规的模型,主干网络提取特征后直接预测年龄回归值,然后离散化为最后结果,这样做没有考虑到不同年龄段的脸部特征变化的不同,也导致回归误差较大。进一步的,传统的方法也有采用先进行粗糙分类在预测年龄的技术手段,但是传统的方法都是将最后的精细回归接在模型结构的最后端,这样做没有很好的利用主干的特征提取能力。进一步的,传统的回归方案将年龄视为一个连续、每个年龄差都同差异的任务,但是众所周知不同年龄段的相差一岁,脸部的变化大不相同,进一步导致模型的预测误差增大。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提出一种年龄识别的神经网络结构及其训练方法,能够有效的保证人脸年龄预测的精度,较强的泛化能力,可以应用于各种场景的人脸,并且模型轻量且速度快。
[0005]根据本专利技术的一个方面,提供一种年龄识别的神经网络结构,包括:主干网络,该主干网络用于提取图片中的年龄特征信息;分类预测头,该分类预测头与主干网络相连,用于通过年龄特征信息判别年龄段;排序预测头,该排序预测头与主干网络相连,用于根据年龄段预测每个年龄的概率累积和,并根据概率累积和进行排序。
[0006]在上述技术方案中,提出一个先分年龄段分类,后进行年龄等级排序的预测模型,以提高模型的回归精度,网络分为基础主干网络、分类预测头和排序预测头组成。先由主干网络提取特征,然后进行分类。分类预测头能够很精确的区分不同年龄段并且有助于后续精细分类。传统的方法也有类似的先进行粗糙分类,但是传统的方法都是将最后的精细回归接在分类预测的后面,这样做其实没有很好的利用主干的特征提取能力。本技术方案是把分类预测头当成辅助特征提取的有效工具,并且前期训练更加稳定,不会增加精细预测的负担,最后再排序分类出精确的年龄。传统的回归方案将年龄视为一个连续、每个年龄差都同差异的任务,但是众所周知不同年龄段的相差一岁,脸部的变化大不相同。本技术方案中的排序分类方案,将年龄离散化,每个年龄差独立分类,这样可以考虑到年龄之间的非线
性变化。年龄输出为预测的概率累积和。在上述技术方案中能够充分利用模型特征提取的能力,使得人脸年龄检测模型由粗糙预测到精细预测。进一步的,能够利用排序回归解决线性回归没法度量的年龄间非线性变化差距的问题。在上述技术方案中将年龄预测误差控制在很小的范围,且在一些真实场景中有很好的泛化表现。
[0007]在一些实施例中,所述分类预测头至少包括一个年龄段分类预测头。
[0008]在上述技术方案中,分类预测头能够很精确的区分不同年龄段并且有助于后续精细分类。
[0009]在一些实施例中,所述排序预测头具体用于预测n个二分类,n为年龄总数,每个位置的概率值代表预测年龄是否超过该位置代表的年龄值。
[0010]在上述技术方案中,排序是预测n个二分类,n为年龄总数,每个位置的概率值代表预测年龄是否超过该位置代表的年龄值。本网络n为81,即0

80岁,排序预测的分类器也是按0到80有序的分类,每个二分类的概率结果代表预测年龄是否超过该位置代表的年龄值。例如,81个分类器的结果前20个预测超过阈值,从第21个开始预测年龄没有超过,最终根据将预测结果二值化后累加和计算年龄为19。训练时的年龄标签是有序的序列,序列长度为81,年龄多少岁就将序列前多少置为一,剩下为零。所以网络收敛后会形成排序的分类结果。传统的回归方案将年龄视为一个连续、每个年龄差都同差异的任务,但是众所周知不同年龄段的相差一岁,脸部的变化大不相同。本技术方案中的排序分类方案,将年龄离散化,每个年龄差独立分类,这样可以考虑到年龄之间的非线性变化。年龄输出为预测的概率累积和。在上述技术方案中能够利用排序回归解决线性回归没法度量的年龄间非线性变化差距的问题。
[0011]在一些实施例中,所述排序预测头还连接有输出模块,用于输出年龄预测结果。
[0012]在上述技术方案中,设置输出模块能够根据需要来设定输出方式,如可视化方法等,能够更好的展示预测的结果。
[0013]根据本专利技术的另一个方面,提供一种年龄识别的神经网络训练方法,用于训练上述的一种年龄识别的神经网络结构,
[0014]获取不同年龄的人脸图像数据;
[0015]基于人脸图像数据训练神经网络结构中的主干网络以及分类预测头;
[0016]主干网络以及分类预测头训练完成后连入排序预测分支进行联合训练;
[0017]联合训练后移除神经网络结构中的分类预测头,并对排序预测头进行微调得到年龄识别神经网络模型。
[0018]在上述技术方案中,为了让网络学得精细的人脸特征,需要分步进行训练。首先,训练主干和分类预测头。该步训练是基础,旨在学习人脸图像的特征表示,和大致年龄段的区别。然后,加入排序预测分支,联合训练。其中排序分支监督权重占比更大。最后,移除分类预测头,对排序预测头进行微调,使得网络取得最佳的效果。通过本方法可以训练上述的一种年龄识别的神经网络结构获得最佳的年龄识别神经网络模型。
[0019]在一些实施例中,所述联合训练过程中,排序预测头的监督权重为百分之八十,分类预测头为百分之二十。
[0020]在上述技术方案中,这样设置的目的是因为最终模型将抛弃分类预测头,只使用排序预测头。所以在联合训练过程中,排序预测头的占比较大,并且最后微调的过程中只训
练预测头。
[0021]在一些实施例中,对排序预测头进行微调,具体包括如下步骤:
[0022]将分类预测头参数冻结,只训练排序预测头;
[0023]学习率设置为联合训练阶段的十分之一,进行十个epoch的迭代,结束后为最终模型。
[0024]在上述技术方案中,这样设置的目的是因为最终只使用排序预测头。在训练的尾段把分类预测头的参数剔除并不进行监督,慢慢的使得网络只关注排序预测头,同时也会提升排序预测头的预测能力(因为只监督排序预测头),从而达到最后的效果。
[0025]根据本专利技术的另一个方面,提供一种年龄识别的神经网络训练装置,所述装置包括依次电连接的获取模块、第一训练模块、第二训练模块以及微调模块;
[0026]所述获取模块用于获取不同年龄的人脸图像数据;
[0027]所述第一训练模块用于基于人脸图像数据训练神经本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种年龄识别的神经网络结构,其特征在于,包括:主干网络,该主干网络用于提取图片中的年龄特征信息;分类预测头,该分类预测头与主干网络相连,用于通过年龄特征信息判别年龄段;排序预测头,该排序预测头与主干网络相连,用于根据年龄段预测每个年龄的概率累积和,并根据概率累积和进行排序。2.如权利要求1所述的一种年龄识别的神经网络结构,其特征在于,所述分类预测头至少包括一个年龄段分类预测头。3.如权利要求1所述的一种年龄识别的神经网络结构,其特征在于,所述排序预测头具体用于预测n个二分类,n为年龄总数,每个位置的概率值代表预测年龄是否超过该位置代表的年龄值。4.如权利要求1所述的一种年龄识别的神经网络结构,其特征在于,所述排序预测头还连接有输出模块,用于输出年龄预测结果。5.一种年龄识别的神经网络训练方法,其特征在于,用于训练如权利要求1

4任一项所述的一种年龄识别的神经网络结构,获取不同年龄的人脸图像数据;基于人脸图像数据训练神经网络结构中的主干网络以及分类预测头;主干网络以及分类预测头训练完成后连入排序预测分支进行联合训练;联合训练后移除神经网络结构中的分类预测头,并对排序预测头进行微调得到年龄识别神经网络模型。6.如权利要求5所述的一种年龄识别的神经网络训练方法,其特征在于,所述联合训练过程中,排序预测头的监督权重为百分...

【专利技术属性】
技术研发人员:柯凌捷施荣晓
申请(专利权)人:厦门真景科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1