一种增加不确定性预测的年龄估计方法技术

技术编号:38717086 阅读:9 留言:0更新日期:2023-09-08 14:59
本发明专利技术公开了一种增加不确定性预测的年龄估计方法。本发明专利技术包括如下步骤:1:对输入的批量人脸图像进行预处理和图像增强;2:将处理后的图像输入到特征提取网络进行特征提取,将提取到的特征值输入到年龄均值网络F和不确定性网络N进行计算;步骤3:以年龄均值网络输出和对应年龄不确定性网络输出分别为正态分布的均值和方差,从该正态分布中采样得到预测年龄;步骤4:通过MSE计算损失函数,反向传播更新参数;步骤5:针对数据集中所有数据重复50次步骤1到步骤4。本发明专利技术根据人脸年龄估计特点所设计的图像增强以及年龄不确定性的定量引入,使得模型泛化能力更强,可以更有效的预测人脸年龄。龄。龄。

【技术实现步骤摘要】
一种增加不确定性预测的年龄估计方法


[0001]本专利技术涉及计算机视觉
,具体涉及一种增加不确定性预测的年龄估计方法。

技术介绍

[0002]年龄估计在视频监控、社交网络和人机交互等方面有着广泛的应用。许多已发表的方法仅将年龄估计视为一个精确的年龄计算问题,因此忽略了人脸图像和年龄之间本身存在歧义性和不确定性。

技术实现思路

[0003]本专利技术提出一种增加不确定性预测的年龄估计方法,旨在将人脸图像和年龄之间本身存在歧义性和不确定性引入年龄估计中,让年龄估计结果更加符合现实情况。
[0004]为实现以上的目的,本专利技术是通过以下技术方案来实现的:
[0005]步骤1:对输入的批量人脸图像进行预处理和图像增强;
[0006]步骤2:将处理后的图像输入到特征提取网络进行特征提取,将提取到的特征值输入到年龄均值网络F和不确定性网络N进行计算;
[0007]步骤3:以年龄均值网络输出F(x)和对应年龄不确定性网络输出N(x)分别为正态分布的均值和方差,从该正态分布中采样得到预测年龄p(x);
[0008]步骤4:通过MSE计算损失函数,反向传播更新参数;
[0009]步骤5:针对数据集中所有数据重复50次步骤1到步骤4。
[0010]进一步的,步骤1中输入图像是RGB三通道的彩色原图。
[0011]进一步的,步骤1中预处理将大小不一致的彩色原图通过双线性插值的方式转换成长宽为256*256的图像然后进行随即边缘裁剪,裁剪到长宽为224*224的图像。
[0012]进一步的,所以图像增强包括将彩色图像转换为黑白图像,以及随机微调彩色图像亮度,最终输出到神经网络的图像包括裁剪到长宽为224*224的原始彩色图像x1、黑白图像x2和调整亮度之后的图像x3。
[0013]进一步的,所述的特征提取网络是改进后resnet18网络,具体将resnet18网络的最后一层全连接层裁剪掉。
[0014]进一步的,步骤2具体实现如下:年龄均值网络F和不确定性网络N都先经过三层全连接网络,且前两层全连接网络的结构相同:512*256和256*128;最后一层全连接网络根据任务不同而不同:年龄均值网络F采用分类的方式进行年龄预测,最后一层的结构对应年龄标签的范围,设最小年龄0最大年龄69,则F的最后一层的结构就是128*70,最后从维度为70的数据取最大值所对应的下标就是F所预测的年龄F(x);不确定性网络N的输出N(x)表示的是年龄的不确定性,作为F输出年龄的方差参与定量计算,采用回归的方式进行预测,因此不确定性网络N最后一层的结构为128*1,输出为1维,即代表方差。
[0015]经过测试,本专利技术具有的有益效果是:
[0016]本专利技术旨在将人脸图像和年龄之间本身存在歧义性和不确定性引入年龄估计中,让年龄估计结果更加符合现实情况。其中的关键就在于引入了不确定性网络,该网络针对图像进行年龄不确定性的评估,最终结合年龄均值网络将这种不确定性体现在了年龄预测的结果中。
[0017]根据人脸年龄估计特点所设计的图像增强以及年龄不确定性的定量引入,使得模型泛化能力更强,可以更有效的预测人脸年龄。在仅有900张图片参与训练的数据集FGNET上,平均预测年龄误差相比没有不确定性预测的方法降低了半岁,从3.3岁降低到2.8岁。
附图说明
[0018]图1本专利技术方法执行流程图。
具体实施方式
[0019]下面结合附图对本专利技术的具体实施方案做作进一步说明。
[0020]本专利技术主要提出一种增加不确定性预测的年龄估计方法,以提高算法模型年龄估计的准确性,图1是本专利技术的具体实施步骤:
[0021]步骤1:批量人脸图像输入,数量为n,预处理和图像增强。输入图像是RGB三通道的彩色原图;预处理将大小不一致的彩色原图通过双线性插值的方式转换成长宽为256*256的图像然后进行随即边缘裁剪,裁剪到长宽为224*224的图像;基于黑白图像以及图像亮度对年龄判断影响不大,所以图像增强包括将彩色图像转换为黑白图像,以及随机微调彩色图像亮度,最终输出到神经网络的图像包括裁剪到长宽为224*224的原始彩色图像x1、黑白图像x2和调整亮度之后的图像x3。
[0022]步骤2:将图像x输入到特征提取网络(裁剪掉最后一层全连接层的resnet18)进行特征提取,将提取到的特征值(维度是512)输入到两个不同的任务网络进行计算(分别称为年龄均值网络F和不确定性网络N)。F和N都先经过三层全连接网络,前两层的结构相同:512*256和256*128,最后一层根据任务不同而不同,F采用分类的方式进行年龄预测,最后一层的结构对应年龄标签的范围,例如FGNET最小年龄0最大年龄69,F的最后一层的结构就是128*70,最后从维度为70的数据取最大值所对应的下标就是F所预测的年龄F(x)。N的输出N(x)表示的是年龄的不确定性,作为F输出年龄的方差参与定量计算,采用回归的方式进行预测,因此N最后一层的结构为128*1,输出为1维,即代表方差。
[0023]步骤3:以年龄均值网络输出F(x)和对应年龄不确定性网络输出N(x)分别为正态分布的均值和方差,从该正态分布中采样得到预测年龄p(x)。具体的技巧是先从标准正态分布中随机采样,然后乘以不确定性网络的结果,最后加上年龄均值网络的结果得到的就是预测的年龄。
[0024]步骤4:通过meansquarederror(MSE)计算损失函数,反向传播更新参数。
[0025][0026]其中p(x1),p(x2),p(x3)分别为图像增强后的三张图像经过以上步骤得到的预测年龄,y表示这张图片人脸的真实年龄,n表示最初批量输入的图片数量。
[0027]步骤5:针对数据集中所有数据进行以上步骤算一次,重复50次。
[0028]通过上述步骤得到的方法是根据重复测试产生的,可以有效提高模型的年龄估计能力。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种增加不确定性预测的年龄估计方法,其特征在于包括如下步骤:步骤1:对输入的批量人脸图像进行预处理和图像增强;步骤2:将处理后的图像输入到特征提取网络进行特征提取,将提取到的特征值输入到年龄均值网络F和不确定性网络N进行计算;步骤3:以年龄均值网络输出F(x)和对应年龄不确定性网络输出N(x)分别为正态分布的均值和方差,从该正态分布中采样得到预测年龄p(x);步骤4:通过MSE计算损失函数,反向传播更新参数;步骤5:针对数据集中所有数据重复50次步骤1到步骤4。2.根据权利要求1所述的一种增加不确定性预测的年龄估计方法,其特征在于步骤1中输入图像是RGB三通道的彩色原图。3.根据权利要求2所述的一种增加不确定性预测的年龄估计方法,其特征在于步骤1中预处理将大小不一致的彩色原图通过双线性插值的方式转换成长宽为256*256的图像然后进行随即边缘裁剪,裁剪到长宽为224*224的图像。4.根据权利要求2或3所述的一种增加不确定性预测的年龄估计方法,其特征在于所以图像增强包括将彩色图像转换为黑白图像,以及随机微调彩色图像亮度,最终输出到神经网络的图像包括裁剪到长宽为224*224的原始彩色图像x1、黑白图像x2和调整亮度之后的图像x3。5.根据权利要求4所述的一种增加不确定性预测的年龄估计方法,其特征在于所述的特征提取网络是改进后res...

【专利技术属性】
技术研发人员:李建军郑祥田万勇赵露露
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1