System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 在线知识蒸馏方法、目标检测方法和系统、终端及介质技术方案_技高网

在线知识蒸馏方法、目标检测方法和系统、终端及介质技术方案

技术编号:41203581 阅读:1 留言:0更新日期:2024-05-07 22:29
本申请提供一种在线知识蒸馏方法、目标检测方法和系统、终端及介质,包括将训练图像集输入至学生模型,利用学生模型的主干网络提取高级语义特征后,利用第一特征金字塔提取第一多尺度特征,再利用轻量检测头进行目标检测,得到第一目标检测结果;将高级语义特征和第一多尺度特征输入至辅助网络,得到第二目标检测结果;基于第一目标检测结果和第二目标检测结果计算损失值,通过反向传播算法迭代优化学生模型和辅助网络的参数,提取参数优化后的学生模型作为目标检测模型。本申请无需额外训练教师模型,在不增加计算量和参数量的情况下,提升了轻量级学生模型的精度,并节省了显卡设备资源消耗,适用于需要快速适应新数据或动态环境的应用场景。

【技术实现步骤摘要】

本申请属于图像处理,具体涉及一种在线知识蒸馏方法、目标检测方法和系统、终端及介质


技术介绍

1、近年来,深度学习和卷积神经网络(cnn)在计算机视觉和其他领域取得了巨大的发展。深度学习模型的不断演进和优化,使得cnn在图像识别、目标检测、语义分割等任务上取得了显著的成就。然而,随着网络模型的不断扩大和加深,参数量和推理延迟也随之增加,导致实际部署中的性能和效率问题。例如,大型模型通常具有巨大的参数量,导致模型的训练和推理时间增加,难以满足实时性的要求。此外,大型模型的存储和计算资源需求也较高,限制了其在移动设备和嵌入式系统等资源受限环境下的应用。

2、为了解决这些问题,知识蒸馏作为一种模型压缩手段应运而生。知识蒸馏通过将大型“教师”模型的知识迁移至轻量级的“学生”模型,帮助学生模型达到与教师模型相当的性能。这种轻量化的学生模型可以在保持较高性能的同时,减少参数量和推理延迟,满足端侧部署的要求。然而,现有的知识蒸馏算法需要额外训练一个大型模型作为教师模型,这会浪费大量的设备资源和时间成本。另外,现有的在线蒸馏方法主要应用于分类任务,而在检测任务上并没有经验。此外,轻量级学生模型的训练精度难以优化,不具备实际场景的泛化性能。

3、因此,如何提出一种在线知识蒸馏方法,以提升轻量化学生模型的精度,使其能够在资源有限的设备上高效运行,并能够在检测任务上取得更好的效果,实已成为本领域技术人员亟待解决的技术问题。


技术实现思路

1、本申请的目的在于提供一种在线知识蒸馏方法、目标检测方法和系统、终端及介质,用于解决现有技术中轻量级学生模型的训练精度难以优化的技术问题。

2、第一方面,本申请提供一种基于辅助网络的在线知识蒸馏方法,包括:将训练图像集输入至学生模型;所述学生模型包括主干网络、第一特征金字塔和轻量检测头;利用所述主干网络从所述训练图像集中提取高级语义特征后,利用所述第一特征金字塔从所述高级语义特征中提取第一多尺度特征,再利用所述轻量检测头对所述第一多尺度特征进行目标检测,得到第一目标检测结果;将所述高级语义特征和所述第一多尺度特征输入至辅助网络;所述辅助网络共享所述学生模型的主干网络;所述第一多尺度特征进行处理,得到第二目标检测结果;基于所述第一目标检测结果和所述第二目标检测结果计算损失值;根据所述损失值通过反向传播算法迭代优化所述学生模型和所述辅助网络的参数,直到所述损失值收敛或达到预设的训练次数,提取参数优化后的所述学生模型作为目标检测模型。

3、在第一方面的一种实现方式中,所述辅助网络包括第二特征金字塔、融合模块和笨重检测头。

4、在第一方面的一种实现方式中,利用所述辅助网络对所述高级语义特征和所述第一多尺度特征进行处理,得到第二目标检测结果包括:

5、利用所述第二特征金字塔从所述高级语义特征中提取第二多尺度特征;

6、利用所述融合模块将所述第一多尺度特征和所述第二多尺度特征在同一尺度上沿着通道维度进行拼接,得到第三多尺度特征;

7、利用所述笨重检测头对所述第三多尺度特征进行目标检测,得到所述第二目标检测结果。

8、在第一方面的一种实现方式中,基于所述第一目标检测结果和所述第二目标检测结果计算损失值包括:

9、基于所述第一目标检测结果计算第一检测任务损失;

10、基于所述第二目标检测结果计算第二检测任务损失;

11、基于所述第一目标检测结果和所述第二目标检测结果计算蒸馏损失;

12、基于所述第一检测任务损失、所述第二检测任务损失和所述蒸馏损失计算总损失,并将所述总损失作为最终优化目标。

13、在第一方面的一种实现方式中,利用所述轻量检测头对所述第一多尺度特征进行目标检测,得到第一目标检测结果包括:

14、利用所述轻量检测头的分类分支对所述第一多尺度特征进行分类,得到目标类别预测得分fclsstu;

15、利用所述轻量检测头的回归分支对所述第一多尺度特征进行位置标注,得到目标位置预测得分fregstu及目标预测框;

16、计算所述目标类别预测得分fclsstu和真实标签之间的距离,并定义为第一距离;基于所述第一距离计算所述轻量检测头的分类分支损失lclsstu;

17、计算所述目标预测框的中心坐标和真实边界框的中心坐标之间的距离,并定义为第二距离;基于所述第二距离计算所述轻量检测头的回归分支损失lregstu。

18、在第一方面的一种实现方式中,利用所述笨重检测头对所述第三多尺度特征进行目标检测,得到第二目标检测结果包括:

19、利用所述笨重检测头的分类分支对所述第三多尺度特征进行分类,得到目标类别预测得分fclsaux;

20、利用所述笨重检测头的回归分支对所述第三多尺度特征进行位置标注,得到目标位置预测得分fregaux及目标预测框;

21、计算所述目标位置预测得分fregaux和真实标签之间的距离,并定义为第三距离;基于所述第三距离计算所述笨重检测头的分类分支损失lclsaux;

22、计算所述目标预测框的中心坐标和真实边界框的中心坐标之间的距离,并定义为第四距离;基于所述第四距离计算所述笨重检测头的回归分支损失lclsaux。

23、在第一方面的一种实现方式中,基于所述第一目标检测结果和所述第二目标检测结果计算蒸馏损失包括采用如下计算公式:

24、

25、其中,ldis表示所述蒸馏损失,fclsaux表示所述轻量检测头的分类分支输出的目标类别预测得分,fclsaux表示所述笨重检测头的分类分支输出的目标类别预测得分,fregstu表示所述轻量检测头的回归分支输出的目标位置预测得分,fregaux表示所述笨重检测头的回归分支输出的目标位置预测得分。

26、在第一方面的一种实现方式中,基于所述第一目标检测结果计算第一检测任务损失包括采用如下计算公式:

27、lstu=lclsstu+λlregstu

28、

29、

30、其中,lstu表示所述第一检测任务损失;lclsstu表示所述轻量检测头的分类分支损失,表示所述目标类别预测得分fclsstu和真实标签之间的距离,α1,γ为可调超参数;lregstu表示所述轻量检测头的回归分支损失,b表示所述目标预测框的中心坐标,bgt表示所述真实边界框的中心坐标,d(.)表示所述目标预测框的中心坐标和真实边界框的中心坐标之间的距离,iou表示所述目标预测框和所述真实边界框的交并比,c表示最小目标预测框两对角顶点之间的欧式距离,hgt表示所述真实边界框的高,wgt表示所述真实边界框的宽,h表示所述目标预测框的高,w表示所述目标预测框的宽,α2为可调超参数;λ表示所述轻量检测头的分类分支损失和回归分支损失的平衡系数。

31、在第一方面的一种实现方式中,基于所述第二目标检测结果计算第二检测任务损本文档来自技高网...

【技术保护点】

1.一种基于辅助网络的在线知识蒸馏方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述辅助网络包括第二特征金字塔、融合模块和笨重检测头。

3.根据权利要求2所述的方法,其特征在于,利用所述辅助网络对所述高级语义特征和所述第一多尺度特征进行处理,得到第二目标检测结果包括:

4.根据权利要求1所述的方法,其特征在于,基于所述第一目标检测结果和所述第二目标检测结果计算损失值包括:

5.根据权利要求1所述的方法,其特征在于,利用所述轻量检测头对所述第一多尺度特征进行目标检测,得到第一目标检测结果包括:

6.根据权利要求3所述的方法,其特征在于,利用所述笨重检测头对所述第三多尺度特征进行目标检测,得到第二目标检测结果包括:

7.根据权利要求6所述的方法,其特征在于,基于所述第一目标检测结果和所述第二目标检测结果计算蒸馏损失包括采用如下计算公式:

8.根据权利要求5所述的方法,其特征在于,基于所述第一目标检测结果计算第一检测任务损失包括采用如下计算公式:

9.根据权利要求6所述的方法,其特征在于,基于所述第二目标检测结果计算第二检测任务损失包括采用如下计算公式:

10.根据权利要求4所述的方法,其特征在于,基于所述第一检测任务损失、所述第二检测任务损失和所述蒸馏损失计算总损失包括采用如下计算公式:

11.一种目标检测方法,其特征在于,包括:

12.一种目标检测系统,其特征在于,包括:

13.一种终端,其特征在于,包括:处理器及存储器;

14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至11任一项所述的方法。

...

【技术特征摘要】

1.一种基于辅助网络的在线知识蒸馏方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述辅助网络包括第二特征金字塔、融合模块和笨重检测头。

3.根据权利要求2所述的方法,其特征在于,利用所述辅助网络对所述高级语义特征和所述第一多尺度特征进行处理,得到第二目标检测结果包括:

4.根据权利要求1所述的方法,其特征在于,基于所述第一目标检测结果和所述第二目标检测结果计算损失值包括:

5.根据权利要求1所述的方法,其特征在于,利用所述轻量检测头对所述第一多尺度特征进行目标检测,得到第一目标检测结果包括:

6.根据权利要求3所述的方法,其特征在于,利用所述笨重检测头对所述第三多尺度特征进行目标检测,得到第二目标检测结果包括:

7.根据权利要求6所述的方法,其特征在于,基于所述第一目标...

【专利技术属性】
技术研发人员:王弢王朔张昭智
申请(专利权)人:上海湃道智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1