System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种轻量化目标检测方法、装置、计算机程序产品制造方法及图纸_技高网

一种轻量化目标检测方法、装置、计算机程序产品制造方法及图纸

技术编号:41217586 阅读:5 留言:0更新日期:2024-05-09 23:38
本发明专利技术公开了一种轻量化目标检测方法、装置、计算机程序产品,包括:对图像数据进行增强处理,得到增强后的图像数据;利用教师网络和学生网络分别对所述增强后的图像数据进行特征提取,得到教师特征图和学生特征图;利用区域候选网络分别处理教师特征图和学生特征图,通过特征蒸馏针对所述教师特征图和学生特征图进行焦点蒸馏和全局蒸馏,得到学生特征图对应的候选框;根据所述学生特征图对应的候选框,利用分类卷积网络和定位卷积网络生成目标检测结果,其中,所述目标检测结果包括目标分类概率和目标预测框定位信息。本发明专利技术能够实现高精度、高效的轻量化目标检测需求,提高嵌入式设备下目标检测的精确性和泛用性。

【技术实现步骤摘要】

本专利技术涉及一种轻量化目标检测方法、装置、计算机程序产品,属于目标检测。


技术介绍

1、目标检测是计算机视觉中的一个基础任务,图像分割、物体追踪等都要依赖目标检测。随着基于深度学习的目标检测技术的出现,卷积神经网络的应用使得目标检测的效果大大提升。为了获得更好的性能,通常使用更大的主干,这需要更多的计算资源并且推理速度更慢。当目标检测技术运用到无人机航拍技术、医学影像病灶检测等领域时,往往需要将目标检测模型部署在算力小、电池容量小的嵌入式设备中,这时候传统的目标检测方法因其高耗电量、高算力要求、较慢推理速度等而不再适用,为了克服这些缺点,在有限的推理时间内实现强大的目标检测性能,需要对目标检测模型进行轻量化,以便适用目标检测模型部署到嵌入式设备的应用场景。

2、知识蒸馏是一种将大型教师网络中的信息集成到一个紧凑的学生网络中,并在推理过程中不增加额外成本而获得强大性能的方法。主要分为逻辑蒸馏和特征蒸馏,前者是直接匹配网络输出的概率分布,后者是直接匹配中间的特征或者学习特征之间的转换关系。知识蒸馏技术能够完成目标检测的轻量化工作,但是大多数蒸馏方法都是为了分类问题设计的,这导致了知识蒸馏对目标检测的效果不佳。

3、逻辑蒸馏方面,为了适应目标检测的需求,除了对基本的分类结果蒸馏之外,同时对包围框知识进行蒸馏,基于逻辑蒸馏的方法虽然降低了蒸馏本身的时间损耗,但是蒸馏效果相较特征蒸馏还是较差,导致目标检测的准确性较低。特征蒸馏对知识提取的区域进行了探究,对前景点蕴含的知识和背景点蕴含的知识区分蒸馏,两者都达成了较好的结果,但是基于特征蒸馏的方法在引入额外的运算代价的同时,没有使用最高语义水平的知识,蒸馏的效率较低。

4、如何更好的混合逻辑蒸馏和特征蒸馏的优点,实现高准确度、高效的轻量化目标检测需求,是接下来的研究重点。


技术实现思路

1、本专利技术的目的是提供一种轻量化目标检测方法、装置、计算机程序产品,通过损失函数设计提高目标检测过程中知识蒸馏的蒸馏效果和效率,以提高嵌入式设备下的目标检测的精确性和泛用性。

2、为达到上述目的,本专利技术是采用下述技术方案实现的。

3、第一方面,本专利技术提供一种轻量化目标检测方法,包括如下步骤:

4、对图像数据进行增强处理,得到增强后的图像数据;

5、利用教师网络和学生网络分别对所述增强后的图像数据进行特征提取,得到教师特征图和学生特征图;

6、通过特征蒸馏针对所述教师特征图和学生特征图进行焦点蒸馏和全局蒸馏,得到学生特征图对应的候选框;

7、根据所述学生特征图对应的候选框,利用分类卷积网络和定位卷积网络生成目标检测结果,其中,所述目标检测结果包括目标分类概率和目标预测框定位信息。

8、结合第一方面,进一步的,所述增强处理包括:

9、将图像数据按照随机值绕 z轴旋转,随机值的取值范围为[-π/4,π/4];

10、将图像数据按照随机因子进行缩放,随机因子的取值范围为[0.95,1.05]。

11、结合第一方面,进一步的,所述教师网络的骨干网络采用101层残差网络,所述学生网络的骨干网络采用50层残差网络。

12、结合第一方面,进一步的,对所述教师特征图和学生特征图进行焦点蒸馏,包括:

13、利用区域候选网络对教师特征图进行处理,得到教师候选框;

14、基于教师候选框对教师特征图进行掩码处理,得到教师特征图的二分类掩码和比例掩码;

15、通过注意力机制对教师特征图和学生特征图进行焦点蒸馏,得到每一幅特征图对应的注意力特征图及其注意力掩码;

16、根据教师特征图对应的二分类掩码、比例掩码、通道注意力掩码和空间注意力掩码计算特征蒸馏损失,计算公式如下:

17、;

18、其中,表示特征蒸馏损失,、分别为平衡前景和背景作用的超参数, c表示通道总数, h为特征图的高度, w为特征图的宽度,表示教师特征图中像素点的二分类掩码,表示教师特征图中像素点的比例掩码,表示教师特征图中像素点的空间注意力掩码,表示教师特征图中 k通道的通道注意力掩码,表示教师特征图中像素点的值,表示学生特征图中像素点的值, f( )表示自适应层;

19、根据教师特征图和学生特征图的通道注意力掩码和空间注意力掩码计算注意力损失,计算公式如下:

20、;

21、其中,表示注意力损失,为平衡注意力损失的超参数,表示l1损失函数,表示教师特征图对应的空间注意力掩码,表示学生特征图对应的空间注意力掩码,表示教师特征图对应的通道注意力掩码,表示学生特征图对应的通道注意力掩码;

22、根据特征蒸馏损失和注意力损失计算焦点蒸馏损失,计算公式如下:

23、;

24、其中,表示焦点蒸馏损失。

25、结合第一方面,进一步的,针对特征图 f,其对应的注意力特征图的计算公式如下:

26、;

27、;

28、;

29、;

30、其中,表示空间注意力特征图,表示 k通道的特征图,表示通道特征的平均池化结果,为特征图中像素点( i, j)的值,表示通道特征的标准差,表示通道注意力特征图, w( )表示一个全连接层;

31、注意力掩码的计算公式如下:

32、;

33、;

34、其中,表示空间注意力特征图对应的空间注意力掩码,表示通道注意力特征图对应的通道注意力掩码。

35、结合第一方面,进一步的,通过gcblock网络对教师特征图和学生特征图进行全局蒸馏,并计算全局蒸馏损失,计算公式如下:

36、;

37、其中,表示全局蒸馏损失,为平衡全局损失的超参数,表示教师特征图经gcblock网络后的输出结果,表示学生特征图经gcblock网络后的输出结果;

38、其中,特征图 f经gcblock网络的输出结果的计算公式为:

39、;

40、其中,表示gcblock网络的第一卷积层,表示gcblock网络的第二卷积层,表示归一化,表示gcblock网络的上下文模型卷积层, c表示通道总数, h为特征图的高度, w为特征图的宽度,为特征图中像素点( 本文档来自技高网...

【技术保护点】

1.一种轻量化目标检测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的轻量化目标检测方法,其特征在于,所述增强处理包括:

3.根据权利要求1所述的轻量化目标检测方法,其特征在于,所述教师网络的骨干网络采用101层残差网络,所述学生网络的骨干网络采用50层残差网络。

4.根据权利要求1所述的轻量化目标检测方法,其特征在于,对所述教师特征图和学生特征图进行焦点蒸馏,包括:

5.根据权利要求4所述的轻量化目标检测方法,其特征在于,针对特征图F,其对应的注意力特征图的计算公式如下:

6.根据权利要求1所述的轻量化目标检测方法,其特征在于,通过GcBlock网络对教师特征图和学生特征图进行全局蒸馏,并计算全局蒸馏损失,计算公式如下:

7.根据权利要求1所述的轻量化目标检测方法,其特征在于,所述根据所述学生特征图对应的候选框,利用分类卷积网络和定位卷积网络生成目标检测结果,包括:

8.根据权利要求1所述的轻量化目标检测方法,其特征在于,所述检测方法还包括根据目标检测结果进行逻辑蒸馏,具体为:

9.一种轻量化目标检测装置,其特征在于,包括:

10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1~8中任一项所述的轻量化目标检测方法的步骤。

...

【技术特征摘要】

1.一种轻量化目标检测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的轻量化目标检测方法,其特征在于,所述增强处理包括:

3.根据权利要求1所述的轻量化目标检测方法,其特征在于,所述教师网络的骨干网络采用101层残差网络,所述学生网络的骨干网络采用50层残差网络。

4.根据权利要求1所述的轻量化目标检测方法,其特征在于,对所述教师特征图和学生特征图进行焦点蒸馏,包括:

5.根据权利要求4所述的轻量化目标检测方法,其特征在于,针对特征图f,其对应的注意力特征图的计算公式如下:

6.根据权利要求1所述的轻量化目标检测方法,其特征在于,...

【专利技术属性】
技术研发人员:徐小龙徐国庆张用明
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1