学生模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号：35147100 阅读：16 留言：0更新日期：2022-10-05 10:24

本发明专利技术公开了一种学生模型训练方法、装置、设备及存储介质。该方法包括：在一次迭代周期中，将样本图像分别输入至学生网络和相应的教师网络；其中，学生网络和所述教师网络用于对样本图像进行目标检测；根据样本图像的标签数据和学生网络的预测结果，确定第一损失值，以及根据样本图像的标签数据和教师网络的预测结果，确定第二损失值；根据第一损失值和第二损失值，确定知识蒸馏对学生网络的第一蒸馏作用程度；基于第一蒸馏作用程度，确定学生网络对应的目标学生损失值；根据目标学生损失值调整所述学生网络的网络参数。本发明专利技术实施例提高了训练得到的学生模型的检测准确度。高了训练得到的学生模型的检测准确度。高了训练得到的学生模型的检测准确度。

全部详细技术资料下载

【技术实现步骤摘要】
学生模型训练方法、装置、设备及存储介质

[0001]本专利技术涉及深度学习
，尤其涉及一种学生模型训练方法、装置、设备及存储介质。

技术介绍

[0002]随着深度学习的不断发展，目标检测技术在近几年飞速发展，目标检测模型不断复杂。目标检测模型在检测性能方面不断提高，但检测过程的耗时不断增加。基于上述问题，提出了基于蒸馏的方法，用学生模型(较为简单的目标检测模型)通过蒸馏方法学习教师模型(复杂的目标检测模型)的网络黑盒知识。
[0003]但现有技术中学生模型通过蒸馏方法学习教师模型的过程中，存在学生模型的检测能力受限于教师模型的检测能力，导致学生模型对教师模型完全依赖，限制了学习模型在训练过程中准确度的提高。

技术实现思路

[0004]本专利技术提供了一种学生模型训练方法、装置、设备及存储介质，以提高训练得到的学生模型的检测准确度。
[0005]根据本专利技术的一方面，提供了一种学生模型训练方法，该方法包括：
[0006]在一次迭代周期中，将样本图像分别输入至学生网络和相应的教师网络；其中，所述学生网络和所述教师网络用于对所述样本图像进行目标检测；
[0007]根据所述样本图像的标签数据和所述学生网络的预测结果，确定第一损失值，以及根据所述样本图像的标签数据和所述教师网络的预测结果，确定第二损失值；
[0008]根据所述第一损失值和所述第二损失值，确定知识蒸馏对所述学生网络的第一蒸馏作用程度；
[0009]基于所述第一蒸馏作用程度，确定所述学生网络对...

【技术保护点】

【技术特征摘要】
1.一种学生模型训练方法，其特征在于，包括：在一次迭代周期中，将样本图像分别输入至学生网络和相应的教师网络；其中，所述学生网络和所述教师网络用于对所述样本图像进行目标检测；根据所述样本图像的标签数据和所述学生网络的预测结果，确定第一损失值，以及根据所述样本图像的标签数据和所述教师网络的预测结果，确定第二损失值；根据所述第一损失值和所述第二损失值，确定知识蒸馏对所述学生网络的第一蒸馏作用程度；基于所述第一蒸馏作用程度，确定所述学生网络对应的目标学生损失值；根据所述目标学生损失值调整所述学生网络的网络参数。2.根据权利要求1所述的方法，其特征在于，所述基于所述第一蒸馏作用程度，确定所述学生网络对应的目标学生损失值，包括：根据所述第一蒸馏作用程度，确定所述学生网络对应的第一蒸馏权重值；确定所述学生网络训练产生的第一蒸馏损失值；根据所述第一损失值、所述第一蒸馏损失值和所述第一蒸馏权重值，确定所述学生网络对应的目标学生损失值。3.根据权利要求2所述的方法，其特征在于，所述根据所述第一损失值、所述第一蒸馏损失值和所述第一蒸馏权重值，确定所述学生网络对应的目标损失值，包括：基于所述第一蒸馏权重值，调整所述第一蒸馏损失值；根据所述第一损失值与调整后的第一蒸馏损失值的加和，得到所述学生网络对应的目标学生损失值。4.根据权利要求1所述的方法，其特征在于，所述学生网络的预测结果包括第一分类预测值和第一回归预测值；相应的，根据所述样本图像的标签数据和所述学生网络的预测结果，确定第一损失值，包括：根据所述第一分类预测值和所述标签数据中的类别标签值，确定所述第一分类损失值；以及，根据所述第一回归预测值和所述标签数据中的位置标签值，确定所述第一回归损失值；根据所述第一分类损失值和所述第一回归损失值，生成所述第一损失值。5.根据权利要求1所述的方法，其特征在于，所述教师网络的预测结果包括第二分类预测值和第二回归预测值；相应的，根据所述样本图像的标签数据和所述教师网络的预测结果，确定第二损失值，包括：根据所述第二分类预测值和所述标签数据中的类别标签值，确定所述第二分类损失值；以及，根据所述第二回归预测值和所述标签数据中的位置标签值，确定所述第二回归损失值；根据所述第二分类损失值和所述第二回归损失值，生成所述第二损失值。6.根据权利要求2所述的方法，其特征在于，所述确定所述学生网络训练产生的第一蒸
馏损失值，包括：确定所述学生网络的网络层进行特征提取后得到的第一预测特征值，以及确定所述教师网络的网络层进行特征...

【专利技术属性】
技术研发人员：李林超，王威，周凯，张腾飞，
申请(专利权)人：浙江啄云智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人