多任务模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号:35722783 阅读:29 留言:0更新日期:2022-11-26 18:19
本发明专利技术公开了一种多任务模型训练方法及装置、人脸属性识别方法及装置、设备及存储介质,训练方法包括:在进行每轮训练时,通过从训练集中预留出一部分训练数据作为评估数据,从而在利用剩余的训练数据进行正向传播之后,利用正向传播得到的损失和评估数据计算出模型中每个任务的增益值,再通过增益值动态调整每个任务的损失权重,以动态调整每个任务在训练过程中的重要性占比,进而利用由调整后的损失权重获得的损失优化模型中的参数,以确保模型中每个任务得到充分训练,让每个任务都能表项优秀。优秀。优秀。

【技术实现步骤摘要】
多任务模型训练方法、装置、设备及存储介质


[0001]本专利技术涉及计算机
,具体涉及一种多任务模型训练方法及装置、人脸属性识别方法及装置、设备及存储介质。

技术介绍

[0002]人脸属性识别旨在基于给定的人脸图像,准确识别出丰富的细节描述,人脸属性多种多样,包括年龄、性别、种族以及各种体貌特征等。人脸属性识别在监控安防、娱乐、刑侦、金融等各方各面都有着广泛的用途。
[0003]目前,随着神经网络的加深,面对一个模型进行多个属性预测的问题,是在特征提取模块后面加上N(任务数量)个全连接层的分支,每一分支负责一个预测任务,将每个任务的损失函数加权相加,得到总体的损失函数。但是这种方式难以在全局表现优秀的情况下,保证每个任务都得到充分训练,甚至难以达到全局表现优秀的效果。

技术实现思路

[0004]本专利技术的目的是针对上述现有技术的不足提出的一种多任务模型训练方法及装置、人脸属性识别方法及装置、设备及存储介质,该目的是通过以下技术方案实现的。
[0005]本专利技术的第一方面提出了一种多任务模型训练方法,所述本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多任务模型训练方法,其特征在于,所述方法包括:在进行每轮训练时,从训练集中划分出训练数据和评估数据,并将所述训练数据输入多任务模型进行正向传播,以得到第一总损失,所述第一总损失基于上一轮训练过程中的每个任务的损失权重得到;利用所述第一总损失和所述评估数据确定每个任务的增益;根据每个任务的增益调整每个任务的的损失权重,并基于调整后的损失权重得到第二总损失;根据所述第二总损失优化所述多任务模型中的网络参数。2.根据权利要求1所述的方法,其特征在于,所述利用所述第一总损失和所述评估数据确定每个任务的增益,包括:对所述多任务模型中的网络参数进行反向求导,得到所述网络参数的梯度;利用所述评估数据和每个任务的预设评估函数,得到每个任务的评估值;针对每个任务,根据所述第一总损失、所述任务的评估值和所述梯度,计算所述任务的增益。3.根据权利要求2所述的方法,其特征在于,所述利用所述评估数据和每个任务的预设评估函数,得到每个任务的评估值,包括:将所述评估数据输入所述多任务模型,以得到每个任务的输出数据;针对每个任务,将所述评估数据和所述任务的输出数据输入所述任务的预设评估函数,以得到所述任务的评估值。4.根据权利要求1所述的方法,其特征在于,所述根据每个任务的增益调整每个任务的损失权重,包括:根据每个任务的增益确定增益和;针对每个任务,根据所述任务的增益和所述增益和,计算所述任务对应的新的损失权重。5.根据权利要求1所述的方法,其特征在于,所述从训练集中划分出训练数据和评估数据,包括:按照预设比例将所述训练集划分为两部分;将其中一部分作为训练数据,另一部分作为评估数据;其中,所述训练数据的数量大于所述评估数据的数量。6.根据权利要求1所述的方法,其特征在于,所述方法还包括训练集的获取过程:收集多帧人脸图像和一帧标准人脸图像;对每帧人脸图像和所述标准人脸图像进行人脸关键点检测;针对每帧人脸图像,将该帧人脸图像的人脸关键点与所述标准人脸图像的人脸关键点进行对齐处理,以得到处理后的人脸图像;将每帧处理后的人脸图像和所述标准人脸图像均缩放至预设大小后标注相应的属性标签并添加到训练集中。...

【专利技术属性】
技术研发人员:降小龙刘聪杨浩杰
申请(专利权)人:北京新氧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1