一种多任务模型的训练方法及装置制造方法及图纸

技术编号：34693523 阅读：10 留言：0更新日期：2022-08-27 16:28

本公开提供一种多任务模型的训练方法及装置，基于包括类别标签的第一训练数据集，对待训练的多任务模型进行训练，基于包括特征标签的第二训练数据集，对使用第一训练数据集训练后的多任务模型进行训练，基于包括解码标签的第三训练数据集，对使用第二训练数据集训练后的多任务模型进行训练，以得到包括分类网络、解码网络以及特征提取网络的多任务模型，其中，特征提取网络是分类网络的子网络，解码网络是特征提取网络的子网络，本公开提供的训练方法，通过对待训练的多任务模型进行分层训练，以实现提升多任务模型的扩展性的同时提高对多任务模型的训练效率。对多任务模型的训练效率。对多任务模型的训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种多任务模型的训练方法及装置

[0001]本公开涉及智能驾驶
，尤其涉及一种多任务模型的训练方法及装置。

技术介绍

[0002]随着人工智能领域的技术突破，高级驾驶辅助系统和无人驾驶技术有了飞速发展，感知算法作为高级驾驶辅助系统和无人驾驶技术的重要部分，是车辆实现安全驾驶的先决条件。车辆可通过如车载摄像头等车载传感器获取车辆当前环境信息，之后车载处理系统通过感知算法对环境信息进行处理提炼，供车辆控制系统做出相应决策。
[0003]感知算法大多依赖于多任务模型实现计算，多任务模型能并行处理的子任务越多，说明该多任务模型的扩展性越好，但是，多任务模型的扩展性越好，对该多任务模型进行训练的时间越长，因此，如何在提升多任务模型的扩展性的同时、提高对多任务模型的训练效率是亟需解决的问题。

技术实现思路

[0004]本公开的实施例提供了一种多任务模型的训练方法及装置，以解决现有技术中对多任务模型的训练效率低的问题。具体地，本公开实施例提供如下技术方案：
[0005]根据本公开的第一个方面，提供了一种多任务模型的训练方法，包括：
[0006]基于包括类别标签的第一训练数据集，对待训练的多任务模型进行训练，得到包括分类网络的多任务模型，所述分类网络用于对预设任务进行分类处理；
[0007]基于包括特征标签的第二训练数据集，对使用第一训练数据集训练后的所述多任务模型进行训练，得到包括特征提取网络的多任务模型，所述特征提取网络用于识别训练数据在预设任务类别中的特征标签，所述特征提取...

【技术保护点】

【技术特征摘要】
1.一种多任务模型的训练方法，包括：基于包括类别标签的第一训练数据集，对待训练的多任务模型进行训练，得到包括分类网络的多任务模型，所述分类网络用于对预设任务进行分类处理；基于包括特征标签的第二训练数据集，对使用第一训练数据集训练后的所述多任务模型进行训练，得到包括特征提取网络的多任务模型，所述特征提取网络用于识别训练数据在预设任务类别中的特征标签，所述特征提取网络是所述分类网络的子网络；基于包括解码标签的第三训练数据集，对使用第二训练数据集训练后的所述多任务模型进行训练，得到包括解码网络的多任务模型，所述解码网络用于对训练数据对应的特征标签进行解码，所述解码网络是所述特征提取网络的子网络。2.根据权利要求1所述的方法，其中，所述第一训练数据集包括第一训练数据和所述第一训练数据对应的所述类别标签；基于包括类别标签的第一训练数据集，对待训练的多任务模型进行训练，包括：利用所述待训练的多任务模型对所述第一训练数据进行预测，得到所述第一训练数据对应的预测任务类别；根据所述预测任务类别和所述类别标签，确定第一损失值；根据所述第一损失值，调整所述分类网络对应的第一组参数。3.根据权利要求2所述的方法，其中，所述第二训练数据集包括第二训练数据和所述第二训练数据对应的特征标签；基于包括特征标签的第二训练数据集，对使用第一训练数据集训练后的所述多任务模型进行训练，包括：利用所述使用第一训练数据集训练后的所述多任务模型对所述第二训练数据进行预测，得到所述第二训练数据对应的预测特征信息；根据所述预测特征信息和所述特征标签，确定第二损失值；根据所述第二损失值，调整所述特征提取网络对应的第二组参数。4.根据权利要求3所述的方法，其中，所述第三训练数据集包括第三训练数据和所述第三训练数据对应的解码标签；基于包括解码标签的第三训练数据集，对使用第二训练数据集训练后的所述多任务模型进行训练，包括：利用所述使用第二训练数据集训练后的所述多任务模型对所述第三训练数据进行预测，得到所述第三训练数据对应的预测解码信息；根据所述预测解码信息和所述解码标签，确定第三损失值；根据所述第三损失值，调整所述解码网络对应的第三组参数。5.根据权利要求4所述的方法，还包括：确定所述第一损失值大于预设的第一阈值，基于所述第一损失值调整所述分类网络对应的第一组参数；确定所述第二损失值大于预设的第二阈值，基于所述第二损失值调整所述特征提取网络对应的第二组参数；确定所述第三损失值大于预设的第三阈值，基于所述第三损失值调整所述解码网络对应的第三组参数。
6.一种多任务模型的训练装置，包括：第一训练模块：基于包括类别标签的第一训练数据集，对待训...

【专利技术属性】
技术研发人员：杜敏，
申请(专利权)人：北京地平线机器人技术研发有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人