多任务学习模型构建方法及装置制造方法及图纸

技术编号：40448471 阅读：5 留言：0更新日期：2024-02-22 23:08

本公开提供了一种多任务学习模型构建方法及装置，涉及计算机技术领域。该方法包括：获取预训练的多任务学习模型，该模型包括目标卷积层；在目标卷积层的后边插入目标采样组件，获得插入采样组件的模型，该目标采样组件包括一个或多个第一滤波器；基于插入采样组件的模型对各个任务分别进行训练以获得各个任务对应的各个第一滤波器的训练完成参数，进而根据参数确定各个任务的稀疏网络结构；根据各个任务的稀疏网络结构计算多个任务之间的模型结构相似度，根据模型结构相似度进行模型调整，获得目标多任务学习模型。该方法能够直接获取到任务之间的模型结构相似度，且不会出现参数数量和计算量随任务数膨胀的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及计算机，尤其涉及深度学习与人工智能，提出一种多任务学习模型构建方法及多任务学习模型构建装置。

技术介绍

1、多任务学习是深度学习领域中得到工业界广泛应用的方向，在自动驾驶和人工智能物联网等边缘计算领域中比较多见，它的目标在于边缘设备的有限计算能力下满足推理速度和性能指标的需要。

2、多任务学习的主要做法是将多个任务的模型合并成为一个模型，通过一次推理获得多个任务的结果。通过多任务学习，不同的任务可以共享信息和知识，相互利用特征，实现特征迁移，提高每个任务的任务指标；所有任务共享部分模型结构，可以减少训练和推理的参数数量，提高训练和推理速度。为了实现多任务学习的作用，需要对模型结构进行合理设计，即对任务进行分组，将模型中的共享网络（即共享部分）合理分配给不同任务。

3、相关技术中，可以基于特征相似度和基于任务亲和度进行任务分组，但是这些方法无法将特征空间相似度映射到模型结构上；可以利用穷举法、层选择法以及滤波器选择法等进行模型构建，然而这些方法存在参数数量和计算量随任务数膨胀的问题。

4、需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

1、本公开的目的在于提供一种多任务学习模型构建方法、多任务学习模型构建装置、电子设备以及计算机存储介质。

2、本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

3、根据本公开的一个方面，提供一种多任务学习模型构建方法，所述方法包括：获取预训练的多任务学习模型；所述预训练的多任务学习模型是对多个任务进行训练获得的，所述预训练的多任务学习模型包括目标卷积层；在所述目标卷积层的后边插入所述目标卷积层对应的目标采样组件，获得插入采样组件的模型；所述目标采样组件包括一个或多个第一滤波器；基于所述插入采样组件的模型对各个任务分别进行训练，获得各个所述任务对应的各个所述第一滤波器的训练完成参数；根据各个所述任务对应的各个所述第一滤波器的训练完成参数分别确定各个所述任务的稀疏网络结构；根据各个所述任务的稀疏网络结构计算所述多个任务之间的模型结构相似度，根据所述模型结构相似度对所述预训练的多任务学习模型进行模型调整，获得目标多任务学习模型。

4、根据本公开的再一个方面，提供一种多任务学习模型构建装置，所述装置包括：模型训练模块，用于获取预训练的多任务学习模型；所述预训练的多任务学习模型是对多个任务进行训练获得的，所述预训练的多任务学习模型包括目标卷积层；组件插入模块，用于在所述目标卷积层的后边插入所述目标卷积层对应的目标采样组件，获得插入采样组件的模型；所述目标采样组件包括一个或多个第一滤波器；所述模型训练模块，还用于基于所述插入采样组件的模型对各个任务分别进行训练，获得各个所述任务对应的各个所述第一滤波器的训练完成参数；结构确定模块，用于根据各个所述任务对应的各个所述第一滤波器的训练完成参数分别确定各个所述任务的稀疏网络结构；模型调整模块，用于根据各个所述任务的稀疏网络结构计算所述多个任务之间的模型结构相似度，根据所述模型结构相似度对所述预训练的多任务学习模型进行模型调整，获得目标多任务学习模型。

5、根据本公开实施例的又一个方面，提供一种电子设备，包括：一个或多个处理器；存储装置，配置为存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现任一项所述的多任务学习模型构建方法。

6、根据本公开实施例的又一个方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得所述电子设备能够执行任一项所述的多任务学习模型构建方法。

7、本公开实施例提供的多任务学习模型构建方法，先获取到预训练的多任务学习模型，该模型包括目标卷积层，即模型的共享网络的卷积层；然后在目标卷积层的后边插入目标采样组件以获得插入采样组件的模型，该目标采样组件中包括一个或多个第一滤波器；接着基于插入采样组件的模型对各个任务分别进行训练，获取到各个任务的稀疏网络结构；最后根据各个任务的稀疏网络结构计算任务之间的模型结构相似度，以便根据模型结构相似度对预训练的多任务学习模型进行模型调整，获得目标多任务学习模型。通过该方法可以直接获取到多个任务之间的模型结构相似度，解决了相关技术中基于特征相似度和基于任务亲和度进行任务分组的方法无法将特征空间相似度映射到模型结构上的问题，且训练时新增的参数数量和计算量可控，避免了参数数量和计算量随任务数膨胀的问题。

8、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

本文档来自技高网...

【技术保护点】

1.一种多任务学习模型构建方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述插入采样组件的模型对各个任务分别进行训练，获得各个所述任务对应的各个所述第一滤波器的训练完成参数，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述模型损失确定所述目标采样组件的梯度，包括：

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述目标卷积层包括一个或多个第二滤波器，所述第二滤波器与所述第一滤波器相对应；

6.根据权利要求5所述的方法，其特征在于，所述多个任务之间的模型结构相似度包括所述多个任务中任意两个任务之间的模型结构相似度；

7.根据权利要求6所述的方法，其特征在于，所述根据所述模型结构相似度对所述预训练的多任务学习模型进行模型调整，获得目标多任务学习模型，包括：

8.根据权利要求1至7任一所述的方法，其特征在于，在所述目标卷积层的后边插入所述目标卷积层对应的目标采样组件之前，所述方法还包括：

<...

【技术特征摘要】

1.一种多任务学习模型构建方法，其特征在于，所述方法包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述模型损失确定所述目标采样组件的梯度，包括：

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述目标卷积层包括一个或多个第二滤波器，所述第二滤波器与所述第一滤波器相对应；

6.根据权利要求5所述的方法，其特征在于，所述多个任务之间...

【专利技术属性】
技术研发人员：张君宇，王鲲，陈飞，邹懋，
申请(专利权)人：北京趋动智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人