System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多粒度阶段回归神经网络的人脸年龄估计方法技术_技高网

一种基于多粒度阶段回归神经网络的人脸年龄估计方法技术

技术编号:40347727 阅读:8 留言:0更新日期:2024-02-09 14:32
本发明专利技术公开了一种基于多粒度阶段回归神经网络的人脸年龄估计方法,属于机器视觉技术领域,包括获取待估计输入图片,根据所述输入图片通过人脸检测器检测不同角度和姿态下的人脸,根据所述人脸原始图像进行多个旋转,以获取对齐后的人脸图片,将对齐后的人脸图片输入到一个采用不同类型的激活函数和池化的双流网络中进行特征提取,不同层次的特征生成不同的阶段的分类结果,对分类结果进行融合得到年龄估计结果;本发明专利技术,通过设置感知细粒度的阶段网络,使用Huber损失函数,使得局部回归器间的连续性关系得到显式建模,解决现有年龄估计中低准确率问题,本发明专利技术的优点为:对人脸图片的年龄估计更加准确,且参数更少。

【技术实现步骤摘要】

本专利技术属于机器视觉,具体涉及一种基于多粒度阶段回归神经网络的人脸年龄估计方法,可用于人脸表观年龄的估计。


技术介绍

1、人脸年龄估计的任务是利用计算机视觉和机器学习技术,通过分析人脸图像预测人的年龄。人脸年龄估计技术在人机交互、社交媒体与图像安全等领域都有着广泛的应用。

2、目前,人脸年龄估计算法可分为两类:基于分类的方法和基于回归的方法。人脸年龄估计是一种利用人脸图像来预测人的年龄的技术,它有着广泛的应用场景,如安全监控、广告推荐、人机交互等。人脸年龄估计的技术路线主要有两种:回归和分类。回归方法是将人脸年龄估计作为一个回归问题来求解,即直接从人脸图像中提取特征,并通过一个回归模型来输出一个连续的年龄值。回归方法的优点是可以得到精确的年龄估计,而且不需要对训练数据进行年龄分组,从而避免了分组误差的影响。回归方法的缺点是对于人脸图像中的噪声、遮挡、光照等因素比较敏感,而且对于不同年龄段的人脸特征可能需要不同的回归模型,导致模型复杂度增加。分类方法是将人脸年龄估计作为一个分类问题来求解,即将人的年龄划分为若干个离散的类别,并从人脸图像中提取特征,通过一个分类模型来输出一个类别标签。分类方法的优点是可以利用分类器的决策边界来处理人脸图像中的噪声、遮挡、光照等因素,而且可以根据不同年龄段的人脸特征来设计不同的分类器,提高模型的泛化能力。分类方法的缺点是需要对训练数据进行年龄分组,从而引入了分组误差,而且不能得到精确的年龄估计,只能得到一个年龄区间。


技术实现思路

1、本专利技术的目的在于提供一种基于多粒度阶段回归神经网络的人脸年龄估计方法,以解决上述
技术介绍
中提出的问题。

2、为实现上述目的,本专利技术提供如下技术方案:一种基于多粒度阶段回归神经网络的人脸年龄估计方法,包括:

3、步骤一、获取待估计输入图片;根据所述输入图片通过人脸检测器检测不同角度和姿态下的人脸,根据所述人脸原始图像进行多个旋转,以获取对齐后的人脸图片;

4、步骤二、以将所述对齐后的人脸图片输入到一个采用不同类型的激活函数和池化的双流网络中进行特征提取;

5、步骤三、四个层次的特征生成各个阶段的分类结果;

6、步骤四、对所述分类结果进行融合得到年龄估计结果;

7、步骤五、优化损失函数,简化模型训练的复杂性,提高模型性能;

8、步骤六、模型训练;

9、步骤七、用训练好的模型对测试样本进行预测并输出人脸图片的预测年龄。

10、作为优选的实施方式,在上述步骤一获取人脸图片中中,具体的步骤为:首先,将数据集中的样本归一化为224×224,以8:2的比例划分出训练集和验证集并对训练样本进行平移、翻转、调整饱和度对比度等一系列数据增强操作。

11、作为优选的实施方式,在上述步骤二中,它的特征提取网络有两个流,每个流有四层卷积层和一层全连接层。第一个流的通道数为32,每个卷积核大小都是3×3,在relu激活函数后进行平均池化。第二个流的通道数为16,每个卷积核大小都是3×3,在relu激活函数后进行最大池化。卷积层用于提取特征,全连接层用于生成分段输出。

12、作为优选的实施方式,在上述步骤三中,网络的每个阶段都会输出一个分段输出。为了整合两个异构的特征流,本方法使用了一个融合块。融合块接收来自两个特征流的特征图,分别经过1×1卷积、激活函数和池化层,得到更紧凑的特征表示。然后这两个特征流会被整合在一起,并通过预测块、元素乘法、全连接层和激活函数生成年龄分布p(k)、偏移向量o和缩放因子s。

13、作为优选的实施方式,在上述步骤四中,所述阶段分类结果进行融合,进一步包括以下几个步骤:

14、1.初始化:首先,初始化一个大的年龄区间[0,100]和一个小的子区间数k=4。这样,第一个阶段负责在[0,100]内进行四分类。

15、2.迭代:迭代得进行以下操作:

16、第一步:生成分段输出。根据当前阶段的输入特征,生成一个分段输出,包括概率分布向量p、偏移向量o和缩放因子s;

17、第二步:计算预测年龄。根据当前阶段的分段输出和固定代表年龄,计算出预测年龄y;

18、第三步更新年龄区间。根据当前阶段的决策(即概率最大的子区间),更新下一个阶段的年龄区间为当前子区间,并对其进行平移和缩放。

19、第四步:增加子区间数。根据当前阶段的子区间数k,增加下一个阶段的子区间数为2k+1。这样,下一个阶段可以在更小的年龄区间内进行更细化的分类。

20、3.终止并输出。最后,当达到预设的最大阶段数或者年龄区间足够小的时候,终止迭代,并输出最终的预测年龄y。

21、网络的最终输出是预测年龄y,它是通过计算期望值得到的,所述年龄的结果公式为:

22、

23、其中k是当前年龄区间内的子区间数,pi是概率分布向量p中第i个元素,ai是每个子区间的固定代表年龄,oi是偏移向量o中第i个元素。

24、作为优选的实施方式,在上述步骤五中,模型的损失为回归损失,其具体改进方法为用huber损失代替分类损失中的mae损失,huber损失的计算公式如下:

25、

26、其中,n是样本数量,yi是第i个样本的真实标签,是第i个样本的预测标签。δ是一个超参数,用于控制huber损失在mse和mae之间的平滑程度。

27、作为优选的实施方式,在上述步骤六中,模型的训练包括以下步骤:网络参数初始化,利用双流网络提取输入图像的特征信息;设置训练参数,初始学习率设为0.001,动量0.9,权值衰减2x10-4。迭代次数(epoch)为200次,批处理(batch size)大小为32,采用sgd优化器;加载训练数据;迭代训练,采用随机梯度下降算法对改进的网络结构进行迭代训练,每迭代200次保存一次网络参数,不断迭代,取得网络最优解。

28、与现有技术相比,本专利技术的有益效果是:

29、本专利技术,通过设置双流结构,在不同细粒度下对年龄进行分类回归,不同阶段共用回归器,减少了大量的参数,提升了模型效率;

30、本专利技术,通过设置huber损失函数部分,使模型在训练时,对预测误差的惩罚是分段的,当误差小于一个阈值时,它使用mse,当误差大于阈值时,它使用mae。这样,它可以减少异常值对损失函数的影响,同时保持连续可导的性质。简化了模型训练的复杂性,使模型在数据集中存在异常值时提供更好的鲁棒性,达到了更好的性能。

31、本专利技术,通过设置与其他常用的人脸年龄估计算法在morph-ii数据集上对比,拥有良好的准确性。

本文档来自技高网...

【技术保护点】

1.一种基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,所述步骤一中,首先,将数据集中的样本归一化为224×224,以8:2的比例划分出训练集和验证集并对训练样本进行平移、翻转、调整饱和度对比度等一系列数据增强操作。

3.根据权利要求1所述的基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,所述步骤二中,它的特征提取网络有两个流,每个流有四层卷积层和一层全连接层。卷积层用于提取特征,全连接层用于生成分段输出。

4.根据权利要求1所述的基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,所述步骤三中,网络共有四个阶段,每个阶段都会输出一个分段输出,每个阶段都会根据输入的人脸图像对当前年龄区间进行动态调整,即平移和缩放。两个流在某个层次上的特征被输入到一个融合块中。融合块负责生成分段输出概率分布向量、偏移向量和缩放因子。

5.根据权利要求1所述的基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,所述步骤四中,进一步包括以下几个步骤:

6.根据权利要求1所述的基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,所述步骤五中,模型的损失为回归损失,其具体改进方法为用Huber损失代替分类损失中的MAE损失,Huber损失的计算公式如下:

7.根据权利要求1所述的基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,所述步骤六中,模型的训练包括以下步骤:

8.根据权利要求7所述的基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,所述步骤7.1网络参数初始化中,具体操作为:利用双流网络提取输入图像的特征信息。

9.根据权利要求7所述的基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,所述步骤7.3加载训练数据中,具体操作为:初始学习率设为0.001,动量0.9,权值衰减2x10-4,采用SGD优化器。

10.根据权利要求7所述的基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,所述步骤7.4迭代训练中,采用随机梯度下降算法对改进的网络结构进行迭代训练,每迭代200次保存一次网络参数,经过不断迭代,取得网络最优解。

...

【技术特征摘要】

1.一种基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,所述步骤一中,首先,将数据集中的样本归一化为224×224,以8:2的比例划分出训练集和验证集并对训练样本进行平移、翻转、调整饱和度对比度等一系列数据增强操作。

3.根据权利要求1所述的基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,所述步骤二中,它的特征提取网络有两个流,每个流有四层卷积层和一层全连接层。卷积层用于提取特征,全连接层用于生成分段输出。

4.根据权利要求1所述的基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,所述步骤三中,网络共有四个阶段,每个阶段都会输出一个分段输出,每个阶段都会根据输入的人脸图像对当前年龄区间进行动态调整,即平移和缩放。两个流在某个层次上的特征被输入到一个融合块中。融合块负责生成分段输出概率分布向量、偏移向量和缩放因子。

5.根据权利要求1所述的基于多粒度阶段回归神经网络的人脸年龄估计方法,其特征在于,所述步骤四中,进一步包...

【专利技术属性】
技术研发人员:谭天胡春龙
申请(专利权)人:江苏科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1