多任务模型训练方法、装置及计算机可读存储介质制造方法及图纸

技术编号：34803169 阅读：17 留言：0更新日期：2022-09-03 20:10

公开了一种多任务模型训练方法、装置及计算机可读存储介质。该方法包括：确定多个数据源对应的多组样本图像，其中，每一数据源对应一组样本图像；确定待训练的多任务模型的目标BN参数、目标权重参数和目标偏置参数；通过多组样本图像，对目标BN参数、目标权重参数和目标偏置参数进行第一阶段训练；将目标BN参数置于推理状态；在目标BN参数的推理状态下，通过多组样本图像对目标权重参数和目标偏置参数进行第二阶段训练。本公开实施例可以提升训练得到的多任务模型的性能。得到的多任务模型的性能。得到的多任务模型的性能。

全部详细技术资料下载

【技术实现步骤摘要】
多任务模型训练方法、装置及计算机可读存储介质

[0001]本公开涉及人工智能技术，尤其是一种多任务模型训练方法、装置及计算机可读存储介质。

技术介绍

[0002]多任务模型中可以设置批量归一化(Batch Normalization，BN)层，以利用BN收敛速度快、泛化性能好的优势，然而，目前设置有BN层的多任务模型的性能较差，难以满足实际需求。

技术实现思路

[0003]为了解决目前设置有BN层的多任务模型的性能差的技术问题，提出了本公开。本公开的实施例提供了一种多任务模型训练方法、装置及计算机可读存储介质。
[0004]根据本公开实施例的一个方面，提供了一种多任务模型训练方法，包括：
[0005]确定多个数据源对应的多组样本图像，其中，每一数据源对应一组样本图像；
[0006]确定待训练的多任务模型的目标BN参数、目标权重参数和目标偏置参数；
[0007]通过所述多组样本图像，对所述目标BN参数、所述目标权重参数和所述目标偏置参数进行第一阶段训练；
[0008]将所述目标BN参数置于推理状态；
[0009]在所述目标BN参数的推理状态下，通过所述多组样本图像对所述目标权重参数和所述目标偏置参数进行第二阶段训练。
[0010]根据本公开实施例的另一个方面，提供了一种多任务模型训练装置，包括：
[0011]第一确定模块，用于确定多个数据源对应的多组样本图像，其中，每一数据源对应一组样本图像；
[0012]第二确定模块，用于确定待训...

【技术保护点】

【技术特征摘要】
1.一种多任务模型训练方法，包括：确定多个数据源对应的多组样本图像，其中，每一数据源对应一组样本图像；确定待训练的多任务模型的目标BN参数、目标权重参数和目标偏置参数；通过所述多组样本图像，对所述目标BN参数、所述目标权重参数和所述目标偏置参数进行第一阶段训练；将所述目标BN参数置于推理状态；在所述目标BN参数的推理状态下，通过所述多组样本图像对所述目标权重参数和所述目标偏置参数进行第二阶段训练。2.根据权利要求1所述的方法，其中，所述目标BN参数包括所述多任务模型的BN均值、BN方差、BN权重和BN偏置，所述目标权重参数包括所述多任务模型的除了BN权重之外的权重，所述目标偏置参数包括所述多任务模型的除了BN偏置之外的偏置；或者，所述目标BN参数包括所述多任务模型的BN均值和BN方差，所述目标权重参数包括所述多任务模型的BN权重和所述多任务模型的除了BN权重之外的权重，所述目标偏置参数包括所述多任务模型的BN偏置和所述多任务模型的除了BN偏置之外的偏置。3.根据权利要求2所述的方法，其中，若所述目标BN参数包括所述多任务模型的BN均值、BN方差、BN权重和BN偏置，所述将所述目标BN参数置于推理状态，包括：将所述多任务模型中BN层的层状态值设置为第一预设值；将所述多任务模型中BN权重和BN偏置各自的参数状态值均设置为第二预设值；或者，若所述目标BN参数包括所述多任务模型的BN均值和BN方差，所述将所述目标BN参数置于推理状态，包括：将所述多任务模型中BN层的层状态值设置为第一预设值。4.根据权利要求1所述的方法，其中，所述将所述目标BN参数置于推理状态，包括：将所述多任务模型中的特征提取网络的第一BN参数置于推理状态，所述第一BN参数至少包括所述特征提取网络的BN均值和BN方差；将所述多任务模型中的特征融合网络的第二BN参数置于推理状态，所述第二BN参数至少包括所述特征融合网络的BN均值和BN方差；所述方法还包括：在所述第一BN参数的推理状态下，通过所述多组样本图像对所述特征提取网络的除了所述第一BN参数之外的权重和偏置，所述第二BN参数，所述特征融合网络的除了所述第二BN参数之外的权重和偏置，以及所述多任务模型中的非共享网络的权重和偏置进行第三阶段训练。5....

【专利技术属性】
技术研发人员：周恩慈，张骞，黄畅，
申请(专利权)人：北京地平线信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人