System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 多任务模型的训练方法、多任务处理方法及装置、设备制造方法及图纸_技高网

多任务模型的训练方法、多任务处理方法及装置、设备制造方法及图纸

技术编号:40701099 阅读:4 留言:0更新日期:2024-03-22 10:59
本公开提供了一种多任务模型的训练方法、多任务处理方法及装置、设备,可以应用于计算机技术、人工智能技术和图像处理技术领域。该多任务模型的训练方法包括:利用训练图像样本集训练深度学习模型,得到初始多任务模型,训练图像样本集包括M个训练图像样本,每个训练图像样本包括与S个预测任务各自对应的类别标签,初始多任务模型包括P个网络节点;确定与P个网络节点各自对应的任务相关度,任务相关度包括S个预测任务彼此之间的子任务相关度;根据与P个网络节点各自对应的任务相关度,对初始多任务模型进行拆分处理,得到经拆分的初始多任务模型;利用训练图像样本集训练经拆分的初始多任务模型,得到训练完成的多任务模型。

【技术实现步骤摘要】

本公开涉及计算机技术、人工智能技术和图像处理,更具体地,涉及一种多任务模型的训练方法、多任务处理方法及装置、电子设备、计算机可读存储介质和计算机程序产品。


技术介绍

1、随着计算机技术的发展,由于车辆运行场景的复杂性,应用于车辆运行场景中的模型需要对多种问题同时进行处理和分析,例如交通灯识别、动态物体识别、静态物体识别和车道线识别等。在相关技术中,可以将多任务学习(multi-task learning,mlp)应用于车辆运行场景,利用多任务模型同时解决多个学习任务。

2、在实现本公开构思的过程中,专利技术人发现相关技术中至少存在如下问题:由于多任务模型的模型性能和泛化能力较差,因而导致无法较为有效地保障多任务处理的准确性。


技术实现思路

1、有鉴于此,本公开提供了一种多任务模型的训练方法、多任务处理方法及装置、电子设备、计算机可读存储介质和计算机程序产品。

2、根据本公开的一个方面,提供了一种多任务模型的训练方法,包括:利用训练图像样本集训练深度学习模型,得到初始多任务模型,其中,上述训练图像样本集包括m个训练图像样本,每个上述训练图像样本包括与s个预测任务各自对应的类别标签,上述初始多任务模型包括p个网络节点,m、s和p均为正整数;确定与上述p个网络节点各自对应的任务相关度,其中,上述任务相关度包括上述s个预测任务彼此之间的子任务相关度;根据与上述p个网络节点各自对应的任务相关度,对上述初始多任务模型进行拆分处理,得到经拆分的初始多任务模型;以及,利用上述训练图像样本集训练上述经拆分的初始多任务模型,得到训练完成的多任务模型。

3、根据本公开的实施例,上述利用训练图像样本集训练深度学习模型,得到初始多任务模型包括:将上述训练图像样本集输入至上述深度学习模型,得到与上述s个预测任务各自对应的预测类别信息;基于第一损失函数,根据与上述s个预测任务各自对应的预测类别信息和类别标签,确定第一损失函数值;以及,利用上述第一损失函数值,调整上述深度学习模型的模型参数,得到上述初始多任务模型。

4、根据本公开的实施例,上述确定与上述p个网络节点各自对应的任务相关度包括:针对上述p个网络节点中的第p个网络节点,根据上述第p个网络节点,确定与上述s个预测任务各自对应的第p子损失函数值;以及,根据与上述s个预测任务各自对应的第p子损失函数值,确定与上述第p个网络节点对应的任务相关度。

5、根据本公开的实施例,上述s个预测任务包括第i预测任务和第j预测任务。上述根据与上述s个预测任务各自对应的第p子损失函数值,确定与上述第p个网络节点对应的任务相关度包括:根据上述第p个网络节点的网络参数和与上述第i预测任务对应的第p子损失函数值,确定与上述第i预测任务对应的第i梯度向量;根据上述第p个网络节点的网络参数和与上述第j预测任务对应的第p子损失函数值,确定与上述第j预测任务对应的第j梯度向量;根据上述第i梯度向量和上述第j梯度向量,确定上述第i预测任务和上述第j预测任务之间的子任务相关度;以及,根据与上述第p个网络节点对应的子任务相关度,确定与上述第p个网络节点对应的任务相关度。

6、根据本公开的实施例,上述根据与上述p个网络节点各自对应的任务相关度,对上述初始多任务模型进行拆分处理,得到经拆分的初始多任务模型包括:针对上述p个网络节点中的第p个网络节点,根据上述第p个网络节点,确定在上述第p个网络节点处与上述s个预测任务各自对应的平均子任务相关度;以及,针对上述s个预测任务中的第s个预测任务,响应于与上述第s个预测任务对应的平均子任务相关度小于预设阈值,根据上述第p个网络节点,对上述初始多任务模型进行拆分处理,得到上述经拆分的初始多任务模型。

7、根据本公开的实施例,上述根据上述第p个网络节点,确定在上述第p个网络节点处与上述s个预测任务各自对应的平均子任务相关度包括:根据上述第p个网络节点,确定在上述第p个网络节点处与上述s个预测任务各自对应的第一数目个子任务相关度;以及,根据与上述s个预测任务各自对应的第一数目个子任务相关度,确定与上述s个预测任务各自对应的平均子任务相关度。

8、根据本公开的实施例,上述根据上述第p个网络节点,对上述初始多任务模型进行拆分处理,得到上述经拆分的初始多任务模型包括:根据上述第p个网络节点和上述初始多任务模型,确定待拆分的q个网络节点;以及,根据上述第p个网络节点,在上述初始多任务模型中创建与上述q个网络节点各自对应的拆分网络节点,得到上述经拆分的初始多任务模型。

9、根据本公开的实施例,上述经拆分的初始多任务模型包括第二数目个网络分支。上述利用上述训练图像样本集训练上述经拆分的初始多任务模型,得到训练完成的多任务模型包括:将上述训练图像样本集输入至第二数目个网络分支中的目标网络分支,得到与目标预测任务对应的目标预测类别信息;基于第二损失函数,根据与上述目标预测任务对应的目标预测类别信息和目标类别标签,确定第二损失函数值;以及。利用上述第二损失函数值,调整上述目标网络分支的网络参数,得到上述训练完成的多任务模型。

10、根据本公开的另一个方面,提供了一种多任务处理方法,包括:获取待处理图像;以及,将上述待处理图像输入多任务模型,得到与上述待处理图像对应的多任务处理结果;上述多任务模型是利用多任务模型的训练方法训练得到的。

11、根据本公开的另一个方面,提供了一种多任务模型的训练装置,包括:第一训练模块,用于利用训练图像样本集训练深度学习模型,得到初始多任务模型,其中,上述训练图像样本集包括m个训练图像样本,每个上述训练图像样本包括与s个预测任务各自对应的类别标签,上述初始多任务模型包括p个网络节点,m、s和p均为正整数;确定模块,用于确定与上述p个网络节点各自对应的任务相关度,其中,上述任务相关度包括上述s个预测任务彼此之间的子任务相关度;拆分模块,用于根据与上述p个网络节点各自对应的任务相关度,对上述初始多任务模型进行拆分处理,得到经拆分的初始多任务模型;以及,第二训练模块,用于利用上述训练图像样本集训练上述经拆分的初始多任务模型,得到训练完成的多任务模型。

12、根据本公开的另一个方面,提供了一种多任务处理装置,包括:获取模块,用于获取待处理图像;以及,输入模块,用于将上述待处理图像输入多任务模型,得到与上述待处理图像对应的多任务处理结果;上述多任务模型是利用多任务模型的训练装置训练得到的。

13、根据本公开的另一个方面,提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个指令,其中,当上述一个或多个指令被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如本公开所述的方法。

14、根据本公开的另一个方面,提供了一种计算机可读存储介质,其上存储有可执行指令,上述可执行指令被处理器执行时使处理器实现如本公开所述的方法。

15、根据本公开的另一个方面,提供了一种计算机程序产品,上述计算机程序产品包括计本文档来自技高网...

【技术保护点】

1.一种多任务模型的训练方法,包括:

2.根据权利要求1所述的方法,其中,所述利用训练图像样本集训练深度学习模型,得到初始多任务模型包括:

3.根据权利要求1所述的方法,其中,所述确定与所述P个网络节点各自对应的任务相关度包括:

4.根据权利要求3所述的方法,其中,所述S个预测任务包括第i预测任务和第j预测任务;

5.根据权利要求1至4中任一项所述的方法,其中,所述根据与所述P个网络节点各自对应的任务相关度,对所述初始多任务模型进行拆分处理,得到经拆分的初始多任务模型包括:

6.根据权利要求5所述的方法,其中,所述根据所述第p个网络节点,确定在所述第p个网络节点处与所述S个预测任务各自对应的平均子任务相关度包括:

7.根据权利要求5所述的方法,其中,所述根据所述第p个网络节点,对所述初始多任务模型进行拆分处理,得到所述经拆分的初始多任务模型包括:

8.根据权利要求1至4中任一项所述的方法,其中,所述经拆分的初始多任务模型包括第二数目个网络分支;

9.一种多任务处理方法,包括:

<p>10.一种多任务模型的训练装置,包括:

11.一种多任务处理装置,包括:

12.一种电子设备,包括:

13.一种计算机可读存储介质,其上存储有可执行指令,所述可执行指令被处理器执行时使处理器实现权利要求1至8中任一项或权利要求9所述的方法。

14.一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,所述计算机可执行指令在被执行时用于实现权利要求1至8中任一项或权利要求9所述的方法。

...

【技术特征摘要】

1.一种多任务模型的训练方法,包括:

2.根据权利要求1所述的方法,其中,所述利用训练图像样本集训练深度学习模型,得到初始多任务模型包括:

3.根据权利要求1所述的方法,其中,所述确定与所述p个网络节点各自对应的任务相关度包括:

4.根据权利要求3所述的方法,其中,所述s个预测任务包括第i预测任务和第j预测任务;

5.根据权利要求1至4中任一项所述的方法,其中,所述根据与所述p个网络节点各自对应的任务相关度,对所述初始多任务模型进行拆分处理,得到经拆分的初始多任务模型包括:

6.根据权利要求5所述的方法,其中,所述根据所述第p个网络节点,确定在所述第p个网络节点处与所述s个预测任务各自对应的平均子任务相关度包括:

7.根据权利要求5所述的方...

【专利技术属性】
技术研发人员:刘亚婧
申请(专利权)人:北京京东乾石科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1