基于自适应权重的目标识别网络知识蒸馏方法和系统技术方案

技术编号:33211971 阅读:11 留言:0更新日期:2022-04-27 16:48
本发明专利技术涉及目标识别技术领域,提供一种基于自适应权重的目标识别网络第一知识蒸馏方法和系统。方法包括:获取输入图像;将输入图像输入第一目标识别网络,得到目标识别结果;第一目标识别网络是经第一联合训练后得到的;第一联合训练基于第一样本、第一标签以及第一损失函数执行;第一损失函数包括第一知识蒸馏权重、第一知识蒸馏子函数;第一知识蒸馏权重与第一知识蒸馏子函数的标量部分的乘积为第二设定值。本发明专利技术能够解决作为学生网络的所述第一目标识别网络训练过程不稳定、不易收敛的问题,省去了传统知识蒸馏中复杂低效的超参设定过程,得到计算资源需求更低、识别效率更高的第一目标识别网络执行目标识别任务。第一目标识别网络执行目标识别任务。第一目标识别网络执行目标识别任务。

【技术实现步骤摘要】
基于自适应权重的目标识别网络知识蒸馏方法和系统


[0001]本专利技术涉及目标识别
,尤其涉及一种基于自适应权重的目标识别网络知识蒸馏方法和系统。

技术介绍

[0002]在很多场合,图像所传送的信息比其他形式的信息更丰富、真切和具体。人眼与大脑的协作使得人们可以获取、处理以及理解视觉信息,人类利用视觉感知外界环境信息的效率很高。视觉作为人类获取外界信息的主要载体,计算机要实现智能化,就必须能够处理图像信息。尤其是近年来,以图形、图像、视频等大容量为特征的图像数据处理广泛应用于医学、交通、工业自动化等领域。
[0003]现有技术提供了一些基于神经网络的目标识别方法,但受限于神经网络的固有属性,目标识别的准确率和网络的复杂程度相关性较强,导致一些计算资源受限(或者对识别速度要求较高)的场景下,传统的神经网络方法无法达到很好的效果。
[0004]为了解决这一问题,一些基于知识蒸馏对神经网络模型进行压缩的方法被提出,知识蒸馏(Knowledge Distillation,KD)是一种模型压缩方法,是一种基于“教师

学生网络思想”的训练方法,在工业界被广泛应用。
[0005]然而,现有的知识蒸馏方法中:
[0006]1、教师网络(Teacher Model)与学生网络(Student Model)的匹配较为困难,匹配程度不高的教师网络和学生网络可能产生训练过程不稳定、不收敛的问题;
[0007]2、KD算法对于超参的敏感性较强,超参的设定依赖试错经验。
[0008]可见,现有的知识蒸馏方法存在着适用条件苛刻,算法稳定性不足,试错成本较高的问题。
[0009]因此,如何基于更稳定易收敛的知识蒸馏方法压缩神经网络,以实现更佳的目标识别效果(计算资源需求更低、识别效率更高),成为了业内亟需解决的技术问题。

技术实现思路

[0010]本专利技术提供一种基于自适应权重的目标识别网络知识蒸馏方法和系统,用以解决现有技术中知识蒸馏方法适用条件苛刻,算法稳定性不足,试错成本较高的缺陷,实现计算资源需求更低、效率更高的目标识别。
[0011]本专利技术提供一种基于自适应权重的目标识别网络知识蒸馏方法,包括:
[0012]获取输入图像;
[0013]将所述输入图像输入第一目标识别网络,得到目标识别结果;
[0014]所述第一目标识别网络是经第一联合训练后得到的;所述第一联合训练基于第一样本、第一标签以及第一损失函数执行;所述第一损失函数包括第一知识蒸馏权重、第一知识蒸馏子函数、第一真值权重以及第一真值子函数;
[0015]所述第一真值子函数能够量化所述第一目标识别网络以所述第一样本为输入的
输出相对于所述第一标签的差值;所述第一真值权重为第一设定值;
[0016]所述第一知识蒸馏子函数是关于第一张量和第二张量的非线性函数;所述第一张量是作为学生网络的所述第一目标识别网络以所述第一样本为输入的输出张量;所述第二张量是作为教师网络的第二目标识别网络以所述第一样本为输入的输出张量;所述第二目标识别网络是基于教师样本、教师标签以及教师损失函数训练得到的;
[0017]所述第一知识蒸馏权重与所述第一知识蒸馏子函数的标量部分的乘积为第二设定值。
[0018]根据本专利技术提供的一种基于自适应权重的目标识别网络知识蒸馏方法,所述第一目标识别网络是依次经第二联合训练、第一联合训练后得到的;
[0019]所述第二联合训练基于第二样本、第二标签以及第二损失函数执行;所述第二损失函数包括第二知识蒸馏权重、第二知识蒸馏子函数、第二真值权重以及第二真值子函数;
[0020]所述第二真值子函数能够量化所述第一目标识别网络以所述第二样本为输入的输出相对于所述第二标签的差值;所述第二真值权重为第三设定值;
[0021]所述第二知识蒸馏子函数能够量化作为学生网络的所述第一目标识别网络以所述第二样本为输入的输出,与作为教师网络的第二目标识别网络以所述第二样本为输入的输出之间的差值;所述第二知识蒸馏权重为第四设定值。
[0022]根据本专利技术提供的一种基于自适应权重的目标识别网络知识蒸馏方法,所述第一目标识别网络包括能够推理第一任务的第一分支和能够推理第二任务的第二分支;所述第二目标识别网络包括能够推理第一任务的第三分支和能够推理第二任务的第四分支;
[0023]所述第一真值子函数包括第一任务真值子函数和第二任务真值子函数;所述第一任务真值子函数能够量化所述第一分支的输出相对于所述第一标签中第一任务真值的差值;所述第二任务真值子函数能够量化所述第二分支的输出相对于所述第一标签中第二任务真值的差值;
[0024]所述第一真值权重包括第一任务真值权重和第二任务真值权重;所述第一任务真值权重、第二任务真值权重分别为第五设定值、第六设定值;
[0025]所述第一知识蒸馏子函数包括第一任务知识蒸馏子函数和第二任务知识蒸馏子函数;所述第一任务知识蒸馏子函数是关于所述第一分支输出张量和所述第三分支输出张量的非线性函数;所述第二任务知识蒸馏子函数是关于所述第二分支输出张量和所述第四分支输出张量的非线性函数;
[0026]所述第一知识蒸馏权重包括第一任务知识蒸馏权重和第二任务知识蒸馏权重;所述第一任务知识蒸馏权重与所述第一任务知识蒸馏子函数的标量部分的乘积为第七设定值;所述第二任务知识蒸馏权重与所述第二任务知识蒸馏子函数的标量部分的乘积为第八设定值。
[0027]根据本专利技术提供的一种基于自适应权重的目标识别网络知识蒸馏方法,所述第一联合训练和所述第二联合训练的学习率随着训练次数的增加而减小。
[0028]根据本专利技术提供的一种基于自适应权重的目标识别网络知识蒸馏方法,所述第二设定值是根据所述第二目标识别网络以所述第一样本为输入的输出相对于所述第一标签的差值确定的常数超参。
[0029]根据本专利技术提供的一种基于自适应权重的目标识别网络知识蒸馏方法,所述将所
述输入图像输入第一目标识别网络,得到目标识别结果的步骤包括:
[0030]将包括交通信号灯的输入图像输入第一目标识别网络,得到包括交通信号灯位置和/或交通信号灯类别的目标识别结果。
[0031]本专利技术还提供一种基于自适应权重的目标识别网络知识蒸馏系统,包括:
[0032]获取模块,用于获取输入图像;
[0033]识别模块,用于将所述输入图像输入第一目标识别网络,得到目标识别结果;
[0034]所述第一目标识别网络是经第一联合训练后得到的;所述第一联合训练基于第一样本、第一标签以及第一损失函数执行;所述第一损失函数包括第一知识蒸馏权重、第一知识蒸馏子函数、第一真值权重以及第一真值子函数;
[0035]所述第一真值子函数能够量化所述第一目标识别网络以所述第一样本为输入的输出相对于所述第一标签的差值;所述第一真值权重为第一设定值;
[0036]所述第一知识蒸馏子函数是关于第一张量和第二张量的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于自适应权重的目标识别网络知识蒸馏方法,其特征在于,包括:获取输入图像;将所述输入图像输入第一目标识别网络,得到目标识别结果;所述第一目标识别网络是经第一联合训练后得到的;所述第一联合训练基于第一样本、第一标签以及第一损失函数执行;所述第一损失函数包括第一知识蒸馏权重、第一知识蒸馏子函数、第一真值权重以及第一真值子函数;所述第一真值子函数能够量化所述第一目标识别网络以所述第一样本为输入的输出相对于所述第一标签的差值;所述第一真值权重为第一设定值;所述第一知识蒸馏子函数是关于第一张量和第二张量的非线性函数;所述第一张量是作为学生网络的所述第一目标识别网络以所述第一样本为输入的输出张量;所述第二张量是作为教师网络的第二目标识别网络以所述第一样本为输入的输出张量;所述第二目标识别网络是基于教师样本、教师标签以及教师损失函数训练得到的;所述第一知识蒸馏权重与所述第一知识蒸馏子函数的标量部分的乘积为第二设定值。2.根据权利要求1所述的基于自适应权重的目标识别网络知识蒸馏方法,其特征在于,所述第一目标识别网络是依次经第二联合训练、第一联合训练后得到的;所述第二联合训练基于第二样本、第二标签以及第二损失函数执行;所述第二损失函数包括第二知识蒸馏权重、第二知识蒸馏子函数、第二真值权重以及第二真值子函数;所述第二真值子函数能够量化所述第一目标识别网络以所述第二样本为输入的输出相对于所述第二标签的差值;所述第二真值权重为第三设定值;所述第二知识蒸馏子函数能够量化作为学生网络的所述第一目标识别网络以所述第二样本为输入的输出,与作为教师网络的第二目标识别网络以所述第二样本为输入的输出之间的差值;所述第二知识蒸馏权重为第四设定值。3.根据权利要求1所述的基于自适应权重的目标识别网络知识蒸馏方法,其特征在于,所述第一目标识别网络包括能够推理第一任务的第一分支和能够推理第二任务的第二分支;所述第二目标识别网络包括能够推理第一任务的第三分支和能够推理第二任务的第四分支;所述第一真值子函数包括第一任务真值子函数和第二任务真值子函数;所述第一任务真值子函数能够量化所述第一分支的输出相对于所述第一标签中第一任务真值的差值;所述第二任务真值子函数能够量化所述第二分支的输出相对于所述第一标签中第二任务真值的差值;所述第一真值权重包括第一任务真值权重和第二任务真值权重;所述第一任务真值权重、第二任务真值权重分别为第五设定值、第六设定值;所述第一知识蒸馏子函数包括第一任务知识蒸馏子函数和第二任务知识蒸馏子函数;所述第一任务知识蒸馏子函数是关于所述第一分支输出张量和所述第三分支输出张量的非线性函数;所述第二任务知识蒸馏子函数是关于所述第二分支输出张量和所述第四分支...

【专利技术属性】
技术研发人员:陆强程新景
申请(专利权)人:际络科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1