System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法及系统技术方案_技高网

基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法及系统技术方案

技术编号:40458942 阅读:9 留言:0更新日期:2024-02-22 23:14
本发明专利技术公开了一种基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法及系统,方法如下:S1、选择无锚框目标检测模型;S2、配置教师模型;S3、配置学生模型;S4、准备训练数据,获取用于模型训练的数据集;S5、训练教师模型,将教师模型训练为目标检测模型;S6、应用定位蒸馏损失,通过缩小教师模型与学生模型之间的定位蒸馏损失,将教师模型学习的定位知识以知识蒸馏的方式传递给学生模型;S7、应用分类蒸馏损失,通过缩小教师模型与学生模型之间的分类蒸馏损失,将教师模型学习的分类知识以知识蒸馏的方式传递给学生模型;S8、训练学生模型,使用训练好的教师模型和原始的目标检测数据集联合训练学生模型。

【技术实现步骤摘要】

本专利技术属于计算机科学和机器学习,特别涉及无锚框目标检测技术。无锚框目标检测是计算机视觉中的关键任务,旨在自动检测和定位图像中的目标物体,广泛应用于目标跟踪、自动驾驶、工业质检等领域。本专利技术旨在关注无锚框目标检测中的知识蒸馏技术,以及如何使用改进的定位蒸馏和知识解耦蒸馏方法来提高模型性能和减少计算资源开销,具体提供了一种基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法及系统


技术介绍

1、目标检测在计算机视觉和人工智能领域具有广泛的应用,例如自动驾驶、智能监控系统、物体跟踪以及工业自动化等。传统的目标检测方法通常依赖于复杂且计算成本高昂的深度神经网络,这些网络通常拥有大量的参数和层级。尽管它们在检测准确性方面表现出色,但限制了在资源受限或对实时性要求较高的场景中应用的能力。此外,传统的目标检测方法通常依赖于锚框(anchor)或先验框(prior box)来识别和定位目标。这些方法存在一些局限性,锚框大小和宽高比是固定的,存在不灵活和通用性差的缺点,再则锚框数量和大小的选择可能会影响检测性能,从而需要大量的试验和调整。

2、为了克服上述这两个缺陷,模型压缩技术和无锚框目标检测方法应运而生。其中,知识蒸馏是一种常见的模型压缩方法。知识蒸馏通过从复杂的教师模型中提取知识,并将其传递给轻量级的学生模型,从而实现了模型的压缩。无锚框方法直接从特征图中生成目标的位置和尺寸,而不需要锚框的先验信息。这种方法具有更强的泛化能力,适用于各种目标的检测,包括不同尺寸、形状和数量的目标。

3、因此,本专利技术的背景是基于对目标检测领域的这些挑战和限制,提出了一种新方法,其通过在无锚框目标检测方法上结合改进的定位蒸馏和知识解耦蒸馏技术,以高效地将知识从教师模型传输到学生模型。该技术方案的目标是提高目标检测的准确性和效率,使其能够在实时应用和资源受限的情况下得到广泛应用。


技术实现思路

1、基于上述现状,本专利技术提出一种基于改进定位蒸馏和知识解耦蒸馏的无锚框目标检测方法及系统。本专利技术技术方案采用了无锚框目标检测模型,具体而言,在优选例中使用了fcos作为检测框架。其次,应用了知识蒸馏技术,这种知识蒸馏方法旨在将大型教师模型的知识传递给小型学生模型,以减小模型的计算资源需求。再次,本专利技术引入了改进的定位蒸馏技术,这有助于学生模型更好地理解和预测目标的位置。此外,本专利技术还引入了知识解耦蒸馏技术,该技术主要应用于分类头,以提高分类性能。综上,本专利技术提供了一种创新的无锚框目标检测技术方案,该技术方案通过知识蒸馏、改进的定位蒸馏和知识解耦蒸馏方法,实现了模型性能的提升和计算资源的节省。这一技术在计算机视觉和深度学习领域具有广泛的应用前景。

2、本专利技术采取如下技术方案:

3、基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,包括如下步骤:

4、s1、选择无锚框目标检测模型,以用作知识蒸馏的教师模型和学生模型;

5、s2、配置教师模型,用于传递知识给学生模型;该教师模型具有更大规模的主干网络,以及相应的检测框架。

6、s3、配置学生模型,该学生模型具有轻量级的主干网络,以及相应的检测框架。学生模型的设计旨在减小计算资源需求的同时尽量保持目标检测性能;

7、s4、准备训练数据,获取用于模型训练的数据集,包括图像和相应的标签信息。这些数据将用于教师模型和学生模型的训练;

8、s5、训练教师模型,使用大规模的教师模型对目标检测任务进行训练,并通过经典的目标检测训练过程来优化模型参数,将教师模型训练为高精度的目标检测模型,以便将其知识传递给学生模型;

9、s6、应用定位蒸馏损失。该技术手段通过缩小教师模型与学生模型之间的定位蒸馏损失,将教师模型学习到的定位知识以知识蒸馏的方式传递给学生网络,以有效地传递目标位置的知识;

10、s7、应用分类蒸馏损失。该技术手段通过缩小教师模型与学生模型之间的分类蒸馏损失,将教师模型学习到的分类知识以知识蒸馏的方式传递给学生网络,以有效地传递目标类别的知识;

11、s8、训练学生模型,使用训练好的高精度的教师模型和原始的目标检测数据集来联合训练轻量化的学生模型,这个过程被称为知识蒸馏。在知识蒸馏中,学生模型将尝试学习教师模型的知识,包括目标检测的分类和定位等信息。通过联合训练,学生模型逐渐调整其参数,以使其更好地模仿教师模型的输出。知识蒸馏过程中,通常需要考虑适当的温度参数、损失函数设置以及优化算法,以确保知识有效地传递给学生模型。

12、作为本专利技术的优选方案,在步骤s8之后进行步骤s9、对经过知识蒸馏的学生模型进行性能评估。该步使用各种目标检测性能指标(如精确度、召回率、map等)来评估学生模型在目标检测任务上的性能。与未经知识蒸馏的学生模型进行比较,以验证知识蒸馏方法的有效性和性能提升。

13、作为优选方案,步骤s1中,采用fcos(fully convolutional one-stage)作为检测框架。

14、作为优选方案,步骤s2中,采用以resnet-101为主干网络的fcos检测框架作为教师模型。

15、作为优选方案,步骤s3中,采用以resnet-50为主干网络的fcos检测框架作为学生模型。

16、作为优选方案,步骤s4中,采用ms coco数据集,每张图像有标注文件,train2017用于训练,val2017用于验证。

17、作为优选方案,步骤s5中,采用ms coco数据集训练以resnet-101和fpn为主干和颈部网络的fcos检测框架,其中损失函数使用gfocal v1,训练计划为24个轮次。

18、作为优选方案,步骤s6中具体为:在定位头中,将fcos的位置回归信息(top,bottom,left,right)和中心度(center-ness)五个值采用改进的定位蒸馏方法采用改进的定位蒸馏方法。

19、作为优选方案,步骤s7中,在分类头中,引入了知识解耦蒸馏的方法,将经典的知识蒸馏解耦为目标类知识和非目标类知识,并为它们分配不同的权重,以更好地传递分类信息的知识。

20、作为优选方案,步骤s8中,采用已经训练好的高精度教师模型和原始的目标检测数据集,来联合训练轻量化的学生模型,这个过程被称为知识蒸馏。其中采用优选方案步骤s6中的方法进行定位蒸馏,采用优选方案步骤s7中的方法进行分类蒸馏。

21、作为优选方案,步骤s9中,使用ap、ap50、ap75、aps、apm、apl作为目标检测的性能指标,与未经知识蒸馏直接用数据集训练完成的学生模型进行比较,以验证知识蒸馏方法的有效性和性能提升。

22、本专利技术还公开了一种基于定位蒸馏和知识解耦蒸馏的无锚框目标检测系统,基上述方法技术方案,其包括如下模块:

23、检测模型选择模块:选择无锚框目标检测模型,以用作知识蒸馏的教师模型和学生模型;

24、教师模型配置模块:用于配本文档来自技高网...

【技术保护点】

1.基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,其特征在于,步骤S1中,采用一阶全卷积目标检测FCOS作为检测框架。

3.根据权利要求1所述的基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,其特征在于,步骤S2中,所述的教师模型以ResNet-101作为骨干网络进行特征提取,以特征金字塔网络FPN作为颈部网络进行多级预测,并引入GFocal v1损失函数;和/或,步骤S3中,所述的学生模型以ResNet-50作为骨干网络进行特征提取,以特征金字塔网络FPN作为颈部网络进行多级预测,并引入GFocal v1损失函数。

4.根据权利要求1所述的基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,其特征在于,步骤S4中,采用MS COCO数据集,train2017用于训练,val2017用于验证。

5.根据权利要求3所述的基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,其特征在于,步骤S5中,训练教师模型采用ResNet-101并训练多个轮次,每个轮次都将整个MSCOCO数据集的训练集图片训练一遍。

6.根据权利要求2所述的基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,其特征在于,步骤S6包括将FCOS回归的位置信息和中心度信息进行离散化,生成离散的位置回归信息的概率分布,并通过KL散度进行拟合。

7.根据权利要求1所述的基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,其特征在于,步骤S7中,采用知识解耦蒸馏方法,将知识蒸馏解耦为目标类知识和非目标类知识,并分配不同的权重,其中,目标类知识与非目标类知识分配的权重为1:8。

8.根据权利要求5所述的基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,其特征在于,步骤S8中,采用已经训练好的平均精确度均值mAP为42.6的教师模型和原始的目标检测数据集联合训练学生模型,未经训练的原始学生模型平均精确度均值mAP为38.6。

9.根据权利要求1-8任一项所述的基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,其特征在于,步骤S8后还进行步骤S9,对经过知识蒸馏的学生模型进行性能评估。

10.基于定位蒸馏和知识解耦蒸馏的无锚框目标检测系统,基于权利要求1-9任一项所述的方法,其特征在于,包括如下模块:

...

【技术特征摘要】

1.基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,其特征在于,步骤s1中,采用一阶全卷积目标检测fcos作为检测框架。

3.根据权利要求1所述的基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,其特征在于,步骤s2中,所述的教师模型以resnet-101作为骨干网络进行特征提取,以特征金字塔网络fpn作为颈部网络进行多级预测,并引入gfocal v1损失函数;和/或,步骤s3中,所述的学生模型以resnet-50作为骨干网络进行特征提取,以特征金字塔网络fpn作为颈部网络进行多级预测,并引入gfocal v1损失函数。

4.根据权利要求1所述的基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,其特征在于,步骤s4中,采用ms coco数据集,train2017用于训练,val2017用于验证。

5.根据权利要求3所述的基于定位蒸馏和知识解耦蒸馏的无锚框目标检测方法,其特征在于,步骤s5中,训练教师模型采用resnet-101并训练多个轮次,每个轮次都将整个mscoco数据集的训练...

【专利技术属性】
技术研发人员:吕文涛廖龙杰徐伟强
申请(专利权)人:浙江理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1