年龄预测模型的训练方法、年龄预测方法及相关装置制造方法及图纸

技术编号:35153667 阅读:26 留言:0更新日期:2022-10-05 10:32
本申请实施例涉及人脸图像识别技术领域,公开了一种年龄预测模型的训练方法、年龄预测方法及相关装置,该年龄预测模型包括人脸编码网络、人脸解码网络以及感知机年龄预测网络,通过人脸编码网络对与原始人脸图像的年龄相同的年龄风格图像进行处理,并将处理之后的特征图进行风格融合,进一步通过人脸解码网络对融合后的特征图进行解码,并且,还通过感知机年龄预测网络对原始人脸图像进行年龄预测,构建年龄风格损失函数对年龄预测模型进行训练,本申请能够解决人脸特征的唯一性导致模型泛化能力不足的问题,提高年龄预测的准确度。提高年龄预测的准确度。提高年龄预测的准确度。

【技术实现步骤摘要】
年龄预测模型的训练方法、年龄预测方法及相关装置


[0001]本申请实施例涉及人脸图像识别
,尤其涉及一种年龄预测模型的训练方法、年龄预测方法及相关装置。

技术介绍

[0002]人脸图像包含了多种人脸特征信息,如人脸脸型、人脸皮肤状态、人脸表情、人脸五官、人脸年龄等,其中,人脸年龄作为一项较重要的特征信息,在人脸图像识别领域得到了广泛的应用。例如,在移动设备上运行的一些客户端上,具有人脸年龄识别的功能,其中,客户端通过获取人脸图像,并基于获取到的人脸图像输出识别得到的人脸年龄,以反馈给用户。
[0003]目前,人脸年龄估计方法通常利用卷积神经网络进行,通过构建数据集;将数据集划分为训练集、验证集;在网络输入层对mini

batch进行成对构建,然后送入两个孪生网络中进行训练;对VGG

16网络进行构建;网络训练;使用softmax loss和revisedcontrastive loss共同作为监督信号对网络进行调整;网络测评;最终估计的年龄为softmax层得到的最大概率对应类别。
[0004]但是,这种方式对于输入的图像是采用不同年龄值的成对输入,通过共享网络参数,提取出人脸特征,再通过度量学习,计算成对样本的特征差异,而由于人脸特征具有唯一性,受到相同年龄具有不同人脸特征,导致模型在实际应用中泛化性能较差。

技术实现思路

[0005]本申请实施例提供一种年龄预测模型的训练方法、年龄预测方法及相关装置,以解决人脸特征的唯一性导致模型泛化能力不足的问题,提高年龄预测的准确度。
[0006]第一方面,本申请实施例中提供一种年龄预测模型的训练方法,年龄预测模型包括人脸编码网络、人脸解码网络以及感知机年龄预测网络,方法包括:
[0007]获取人脸数据集,其中,人脸数据集包括多个不同年龄值的人脸图像;
[0008]基于人脸编码网络,对人脸数据集中的原始人脸图像和年龄风格图像进行处理,得到原始人脸图像对应的特征图和年龄风格图像对应的特征图,其中,原始人脸图像和年龄风格图像对应的年龄值相同;
[0009]融合原始人脸图像对应的特征图与年龄风格图像对应的特征图,得到融合后的特征图;
[0010]将融合后的特征图输入到人脸解码网络,得到解码后的人脸图像;
[0011]将原始人脸图像对应的特征图输入到感知机年龄预测网络,其中,感知机年龄预测网络用于预测原始人脸图像对应的年龄;
[0012]构建年龄风格损失函数,基于人脸数据集和年龄风格损失函数,对年龄预测模型进行训练,直至年龄风格损失函数收敛,其中,年龄风格损失函数包括人脸解码网络输出的解码后的人脸图像和原始人脸图像的内容损失,以及,人脸解码网络输出的解码后的人脸
图像和原始人脸图像的风格损失。
[0013]在一些实施例中,融合原始人脸图像对应的特征图与年龄风格图像对应的特征图,得到融合后的特征图,包括:
[0014]将原始人脸图像按照每一像素点的像素值的大小进行排序,并确定原始人脸图像对应的第一排序索引,其中,第一排序索引用于确定原始人脸图像中的每一像素点在排序之前的原始位置;
[0015]将年龄风格图像按照每一像素点的像素值的大小进行排序,并确定年龄风格图像对应的第二排序索引,其中,第二排序索引用于确定年龄风格图像中的每一像素点在排序之前的原始位置;
[0016]根据第一排序索引,对年龄风格图像进行处理,得到处理后的特征图;
[0017]将原始人脸图像与处理后的特征图进行融合,得到融合后的特征图。
[0018]在一些实施例中,
[0019]根据第一排序索引,对年龄风格图像进行处理,得到处理后的特征图,包括:
[0020]根据第一排序索引,对年龄风格图像的每一像素点进行提取,得到处理后的特征图;
[0021]将原始人脸图像与处理后的特征图进行融合,得到融合后的特征图,包括:
[0022]将原始人脸图像的每一像素点的像素值与处理后的特征图的每一像素点的像素值进行一一对应相加,得到每一个像素点的融合像素值,以得到融合后的特征图。
[0023]在一些实施例中,年龄风格损失函数包括:
[0024]Loss=a*L
c
+α*L
pix
+β*L
dis
+γ*L
style
[0025]其中,Loss为年龄风格损失,L
c
为感知机年龄预测网络的预测年龄与真实年龄的年龄交叉熵损失,L
pix
为人脸解码网络输出的解码后的人脸图像和原始人脸图像的内容损失,L
dis
为判别损失,L
style
为人脸解码网络输出的解码后的人脸图像和原始人脸图像的风格损失,a为年龄交叉熵损失对应的权重,α为内容损失对应的第一权重,β为判别损失对应的第二权重,γ为风格损失对应的第三权重。
[0026]在一些实施例中,年龄交叉熵损失包括:
[0027][0028]其中,L
c
为感知机年龄预测网络的预测年龄与真实年龄的年龄交叉熵损失,i为年龄值,n为最大年龄值,Y
i
为年龄值i对应的真实年龄,P
i
为年龄值i对应的预测年龄的概率值。
[0029]在一些实施例中,内容损失,包括:
[0030]L
pix
=E
T,S
[‖T

G(T,S)‖]mse
[0031]其中,L
pix
为人脸解码网络输出的解码后的人脸图像和原始人脸图像的内容损失,T为原始人脸图像,S为与原始人脸图像的年龄相同的年龄风格图像,G(T,S)为人脸解码网络输出的解码后的人脸图像,E
T,S
[‖T

G(T,S)‖]mse
为人脸解码网络输出的解码后的人脸图像与原始人脸图像的均方误差。
[0032]在一些实施例中,年龄预测模型还包括:判别网络,用于判断解码后的人脸图像是否为真实的人脸图像;
[0033]判别损失,包括:
[0034]L
dis
=E
T
[logD(T)]+E
T,S
[log(1

D(G(T,S)))][0035]其中,L
dis
为判别损失,T为原始人脸图像,S为与原始人脸图像的年龄相同的年龄风格图像,G(T,S)为人脸解码网络输出的解码后的人脸图像,D(T)为判别网络对于原始人脸图像的判断真假的概率值,D(G(T,S))为判别网络对于人脸解码网络输出的解码后的人脸图像的判断真假的概率值,E
T
[logD(T)]为判别网络对于原始人脸图像的判断为真的期望值,E
T,S
[log(1

D(G(T,S)))]为判别网络对于人脸解码网络输出的解码后本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种年龄预测模型的训练方法,其特征在于,所述年龄预测模型包括人脸编码网络、人脸解码网络以及感知机年龄预测网络,所述方法包括:获取人脸数据集,其中,所述人脸数据集包括多个不同年龄值的人脸图像;基于所述人脸编码网络,对所述人脸数据集中的原始人脸图像和年龄风格图像进行处理,得到所述原始人脸图像对应的特征图和所述年龄风格图像对应的特征图,其中,所述原始人脸图像和所述年龄风格图像对应的年龄值相同;融合所述原始人脸图像对应的特征图与所述年龄风格图像对应的特征图,得到融合后的特征图;将所述融合后的特征图输入到所述人脸解码网络,得到解码后的人脸图像;将所述原始人脸图像对应的特征图输入到所述感知机年龄预测网络,其中,所述感知机年龄预测网络用于预测所述原始人脸图像对应的年龄;构建年龄风格损失函数,基于所述人脸数据集和所述年龄风格损失函数,对所述年龄预测模型进行训练,直至所述年龄风格损失函数收敛,其中,所述年龄风格损失函数包括人脸解码网络输出的解码后的人脸图像和原始人脸图像的内容损失,以及,人脸解码网络输出的解码后的人脸图像和原始人脸图像的风格损失。2.根据权利要求1所述的方法,其特征在于,所述融合所述原始人脸图像对应的特征图与所述年龄风格图像对应的特征图,得到融合后的特征图,包括:将所述原始人脸图像按照每一像素点的像素值的大小进行排序,并确定所述原始人脸图像对应的第一排序索引,其中,所述第一排序索引用于确定所述原始人脸图像中的每一像素点在排序之前的原始位置;将所述年龄风格图像按照每一像素点的像素值的大小进行排序,并确定所述年龄风格图像对应的第二排序索引,其中,所述第二排序索引用于确定所述年龄风格图像中的每一像素点在排序之前的原始位置;根据所述第一排序索引,对所述年龄风格图像进行处理,得到处理后的特征图;将所述原始人脸图像与所述处理后的特征图进行融合,得到融合后的特征图。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一排序索引,对所述年龄风格图像进行处理,得到处理后的特征图,包括:根据所述第一排序索引,对所述年龄风格图像的每一像素点进行提取,得到处理后的特征图;所述将所述原始人脸图像与所述处理后的特征图进行融合,得到融合后的特征图,包括:将所述原始人脸图像的每一像素点的像素值与所述处理后的特征图的每一像素点的像素值进行一一对应相加,得到每一个像素点的融合像素值,以得到融合后的特征图。4.根据权利要求1

3任一项所述的方法,其特征在于,所述年龄风格损失函数包括:Loss=a*L
c
+α*L
pix
+β*L
dis
+γ*L
style
其中,Loss为年龄风格损失,L
c
为感知机年龄预测网络的预测年龄与真实年龄的年龄交叉熵损失,L
pix
为人脸解码网络输出的解码后的人脸图像和原始人脸图像的内容损失,L
dis
为判别损失,L
style
为人脸解码网络输出的解码后的人脸图像和原始人脸图像的风格损失,a
为年龄交叉熵损失对应的权重,α为内容损失对应的第一权重,β为判别损失对应的第二权重,γ为风格损失对应的第三权重。5.根据权利要求4所述的方法,其特征在于,所述年龄交叉熵损失包括:其中,L
c
为感知机年龄预测网络的预测年龄与真实年龄的年龄交叉熵损失,i为年龄值,n为最大年龄值,Y
i
为年龄值i对应的真实年龄,P
i
...

【专利技术属性】
技术研发人员:陈仿雄
申请(专利权)人:深圳数联天下智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1