一种面向多任务知识融合的模型训练方法及装置制造方法及图纸

技术编号：37549230 阅读：32 留言：0更新日期：2023-05-12 16:27

本说明书公开了一种面向多任务知识融合的模型训练方法及装置。首先，获取图像数据。其次，根据待训练的目标识别模型中的特征块数量，对预先训练的各识别模型进行恒等变换，得到各等量特征块识别模型。然后，针对目标识别模型中包含的每个特征块，从各等量特征块识别模型中确定出与该特征块相对应的特征块，作为目标特征块，将各目标特征块输出的图像特征进行拼接，得到该特征块对应的拼接后图像特征，并将该特征块输出的图像特征与该特征块对应的拼接后图像特征之间的偏差，作为该特征块对应的偏差。最后，以最小化各特征块对应的偏差为优化目标，对目标识别模型进行训练。本方法可以使得目标识别模型能够同时解决预先训练的各识别模型的任务。的各识别模型的任务。的各识别模型的任务。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向多任务知识融合的模型训练方法及装置

[0001]本说明书涉及计算机
，尤其涉及一种面向多任务知识融合的模型训练方法及装置。

技术介绍

[0002]知识蒸馏方法是在训练模型时，使用一个较大的经过训练的模型作为教师模型，训练学生模型模仿教师模型的行为，从而将教师模型中的知识转移到学生模型中的技术。
[0003]但是，目前的知识蒸馏方法中，学生模型仅能学习单个教师模型中的知识，无法学习多个教师模型中的知识，使得学生模型能够同时解决多个教师模型的任务。
[0004]因此，如何使得学生模型能够同时解决多个教师模型的任务，则是一个亟待解决的问题。

技术实现思路

[0005]本说明书提供一种面向多任务知识融合的模型训练方法、装置、存储介质及电子设备，以部分的解决现有技术存在的上述问题。
[0006]本说明书采用下述技术方案：本说明书提供了一种面向多任务知识融合的模型训练方法，包括：获取图像数据，所述图像数据是由若干像素组成的；根据待训练的目标识别模型中的特征块数量，对预先训练的各识别模...

【技术保护点】

【技术特征摘要】
1.一种面向多任务知识融合的模型训练方法，其特征在于，包括：获取图像数据，所述图像数据是由若干像素组成的；根据待训练的目标识别模型中的特征块数量，对预先训练的各识别模型进行恒等变换，得到与所述目标识别模型中的特征块数量相同的各识别模型，作为各等量特征块识别模型，所述特征块由相邻且网络尺寸相同的特征层组成；将所述图像数据输入到所述目标识别模型中，确定所述目标识别模型中的各特征块输出的图像特征；针对目标识别模型中包含的每个特征块，从各等量特征块识别模型中确定出与该特征块相对应的特征块，作为目标特征块，以在将所述图像数据输入到各等量特征块识别模型中时，确定每个目标特征块输出的图像特征，将各目标特征块输出的图像特征进行拼接，得到该特征块对应的拼接后图像特征，并将该特征块输出的图像特征与该特征块对应的拼接后图像特征之间的偏差，作为该特征块对应的偏差；以最小化各特征块对应的偏差为优化目标，对目标识别模型进行训练。2.如权利要求1所述的方法，其特征在于，根据待训练的目标识别模型中的特征块数量，对预先训练的各识别模型进行恒等变换，得到与所述特征块数量相同的各识别模型，作为各等量特征块识别模型，具体包括：针对预先训练的每个识别模型，若确定该识别模型中的特征块数量小于待训练的目标识别模型中的特征块数量，则将该识别模型中的至少一个特征块进行残差连接，构建残差块，得到与所述目标识别模型中的特征块数量相同的该识别模型，作为该识别模型对应的等量特征块识别模型。3.如权利要求1所述的方法，其特征在于，根据待训练的目标识别模型中的特征块数量，对预先训练的各识别模型进行恒等变换，得到与所述特征块数量相同的各识别模型，作为各等量特征块识别模型，具体包括：针对预先训练的每个识别模型，若确定该识别模型中的特征块数量小于待训练的目标识别模型中的特征块数量，则将该识别模型中的至少一个特征块进行单位卷积，构建单位卷积块，得到与所述目标识别模型中的特征块数量相同的该识别模型，作为该识别模型对应的等量特征块识别模型。4.如权利要求1所述的方法，其特征在于，根据待训练的目标识别模型中的特征块数量，对预先训练的各识别模型进行恒等变换，得到与所述特征块数量相同的各识别模型，作为各等量特征块识别模型，具体包括：针对预先训练的每个识别模型，若确定该识别模型中的特征块数量大于待训练的目标识别模型中的特征块数量，则将该识别模型中的至少两个特征块进行合并，构建合并特征块，得到与所述目标识别模型中的特征块数量相同的该识别模型，作为该识别模型对应的等量特征块识别模型。5.如权利要求1所述的方法，其特征在于，从各等量特征块识别模型中确定出与该特征块相对应的特征块，作为目标特征块，具体包括：确定该特征块在所述目标识别模型中所在的位置，作为该特征块对应的位置；从各等量特征块识别模型中确定出与该特征块对应的位置相同的特征块，作为目标特征块。
6.如权利要求1所述的方法，其特征在于，将各目标特征块输出的图像特征进行拼接，得到该特征块对应的拼接后图像特征，具体包括：将各目标特征块输出的图像特征输入到自适应层，得到网络尺寸相同的各目标特征块输出的图像特征，并将所述网络尺寸相同的各目标特征块输出的图像特征进行拼接，得到该特征块对应的拼接后图像特征。7.如权利要求1所述的方法，其特征在于，将该特征块输出的图像特征与该特征块对应的拼接后图像特征之间的偏差，作为该特征块对应的偏差，具体包括：将该特征块对应的拼接后图像特征输入到整合特征层，确定该特征块对应的整合后图像特征；将该特征块输出的图像特征与该特征块对应的整合后图像特征之间的偏差，作为该特征块对应的偏差。8.如权利要求7所述的方法，其特征在于，以最小化各特征块对应的偏差为优化目标，对目标识别模型进行训练，具体包括：将该特征块对应...

【专利技术属性】
技术研发人员：王玉柱，张艾嘉，裘云蕾，段曼妮，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人