System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及计算机视觉领域,特别涉及一种基于平衡蒸馏的快速目标检测方法和装置。
技术介绍
1、近年来,基于深度学习的目标检测模型受到了广泛的关注并取得了突破性的进展。然而,随着性能不断提高,检测模型所需的存储和计算资源迅速增加,难以部署在具有低资源、低功耗需求的实际场景中。因此,如何在尽可能保留高性能的前提下,降低模型的存储和计算推理成本成为一个亟待解决的问题。知识蒸馏是一种新兴的模型压缩方法,通过将大型教师模型中的“知识”传输给小型学生模型,能够以轻微的性能损失为代价,实现模型轻量化。
2、此外,现有目标检测模型主要采用并行分类分支和定位分支的方式,来预测目标的类别和位置坐标。然而,这种并行的工作方式可能产生预测框的分类置信度和定位置信度不一致的问题,导致检测精度下降。传统的解决方法往往需要在原有模型上增加额外的模块,尽管一定程度上缓解了两种分布不和谐的问题,但也增加了模型的复杂程度。
3、综上所述,如何在降低目标检测模型资源需求前提下,提高模型预测的一致性,成为当前
工作人员急需解决的问题。
技术实现思路
1、为了解决现有技术中存在的上述技术问题,本专利技术提出了一种基于平衡蒸馏的快速目标检测方法和装置,在实现目标检测模型轻量化的同时,提高模型分类置信度和定位置信度的一致性,其具体技术方案如下:
2、一种基于平衡蒸馏的快速目标检测方法,包括以下步骤:
3、步骤s1:将训练集图像分别输入大型教师模型和小型学生模型,获取大型教
4、步骤s2:基于教师分类预测图获取教师分类分数,基于教师回归框预测图获取教师定位分数,基于学生分类预测图获取学生分类分数,基于学生回归框预测图获取学生定位分数;
5、步骤s3,基于教师分类分数和教师定位分数获取到教师相关性矩阵,基于学生分类分数和学生定位分数获取到学生相关性矩阵;
6、步骤s4,基于教师相关性矩阵和学生相关性矩阵计算平衡蒸馏损失函数;
7、步骤s5,通过平衡蒸馏损失函数对小型学生模型进行训练调整,得到最终的小型学生模型,后将其部署到终端设备上,进行目标检测。
8、进一步的,所述大型教师模型和小型学生模型均由主干网络和头部网络构成,在模型训练前先加载大型教师模型的预训练权重,冻结大型教师模型的参数,初始化小型学生模型的权重。
9、进一步的,在步骤s2中:
10、基于教师回归框预测图,先获取到教师交并比分数和教师中心偏离度,再基于教师交并比分数和教师中心偏离度获取到教师定位分数;
11、基于学生回归框预测图,先获取到学生交并比分数和学生中心偏离度,再基于学生交并比分数和学生中心偏离度获取到学生定位分数;
12、所述教师分类分数或学生分类分数的表达式为:
13、
14、其中,h表示锚框中心点的空间位置的纵坐标,w表示锚框中心点的空间位置的横坐标,表示锚框在分类预测图中的预测结果,即表示教师或学生的分类分数,分类预测图为所述的教师分类预测图或学生分类预测图其中一者。
15、进一步的,所述教师交并比分数或学生交并比分数的表达式为:
16、
17、其中,delta2bbox表示解码函数,用于得到预测框,表示锚框在回归框预测图中的预测结果,gtg表示图像中的第g个真实框,ioucalculator表示计算预测框和真实框的交并比,即表示教师或学生的交并比分数,回归框预测图为教师回归框预测图或学生回归框预测图其中一者。
18、进一步的,所述教师中心偏离度或学生中心偏离度的表达式为:
19、
20、其中,center表示计算预测框中心点和真实框中心点的欧式距离,diagonal表示计算能够同时包含预测框和真实框的最小闭包区域的对角线距离,即表示教师或学生的中心偏离度。
21、进一步的,所述教师定位分数或学生定位分数的表达式为:
22、
23、其中,即表示教师或学生的定位分数。
24、进一步的,在步骤s3中:
25、所述的基于教师分类分数和教师定位分数获取到教师相关性矩阵的过程,具体包括:
26、基于教师分类分数和教师定位分数计算教师预测置信度;
27、基于教师分类分数和教师预测置信度计算教师分类置信度;
28、基于教师定位分数和教师预测置信度计算教师定位置信度;
29、基于教师分类置信度和教师定位置信度计算教师相关性矩阵;
30、所述的基于学生分类分数和学生定位分数获取到学生相关性矩阵的过程,具体包括:
31、基于学生分类分数和学生定位分数计算学生预测置信度;
32、基于学生分类分数和学生预测置信度计算学生分类置信度;
33、基于学生定位分数和学生预测置信度计算学生定位置信度;
34、基于学生分类置信度和学生定位置信度计算学生相关性矩阵。
35、进一步的,所述教师预测置信度或学生预测置信度的表达式为:
36、
37、其中,即表示教师或学生的预测置信度;
38、所述教师分类置信度或学生分类置信度的表达式为:
39、
40、其中,即表示教师或学生的分类置信度;
41、所述教师定位置信度或学生定位置信度的表达式为:
42、
43、其中,即表示教师或学生的定位置信度;
44、所述教师相关性矩阵或学生相关性矩阵的表达式为:
45、且
46、
47、
48、其中,表示处在(h,w)位置的锚框与第g个真实框的定位置信度,表示定位置信度集合,表示分类置信度集合,n表示集合内元素的个数,mean表示求平均值函数,rg即表示教师或学生的相关性矩阵。
49、进一步的,所述步骤s4中的平衡蒸馏损失函数的表达式为:
50、
51、其中,表示教师相关性矩阵,表示学生相关性矩阵,g表示图像中真实框的数量。
52、一种基于平衡蒸馏的快速目标检测装置,包括:
53、预测图获取模块,用于加载大型教师模型的预训练权重,冻结大型教师模型的参数,初始化小型学生模型的权重,将训练集图像分别输入大型教师模型和小型学生模型,获取大型教师模型输出的教师分类预测图和教师回归框预测图以及小型学生模型输出的学生分类预测图和学生回归框预测图;
54、分数计算模块,用于基于教师分类预测图、教师回归框预测图、学生分类预测图和学生回归框预测图计算教师分类分数、教师定位分数、学生分类分数和学生定位分数;
55、相关性矩阵模块,用于基于教师分类分数、教师定位分数、学生分类分数和学生定位分数计算教师本文档来自技高网...
【技术保护点】
1.一种基于平衡蒸馏的快速目标检测方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于平衡蒸馏的快速目标检测方法,其特征在于,所述大型教师模型和小型学生模型均由主干网络和头部网络构成,在模型训练前先加载大型教师模型的预训练权重,冻结大型教师模型的参数,初始化小型学生模型的权重。
3.如权利要求1所述的一种基于平衡蒸馏的快速目标检测方法,其特征在于,在步骤S2中:
4.如权利要求3所述的一种基于平衡蒸馏的快速目标检测方法,其特征在于,所述教师交并比分数或学生交并比分数的表达式为:
5.如权利要求4所述的一种基于平衡蒸馏的快速目标检测方法,其特征在于,所述教师中心偏离度或学生中心偏离度的表达式为:
6.如权利要求5所述的一种基于平衡蒸馏的快速目标检测方法,其特征在于,所述教师定位分数或学生定位分数的表达式为:
7.如权利要求6所述的一种基于平衡蒸馏的快速目标检测方法,其特征在于,在步骤S3中:
8.如权利要求7所述的一种基于平衡蒸馏的快速目标检测方法,其特征在于,所述教师预测置信度或学生预
9.如权利要求7所述的一种基于平衡蒸馏的快速目标检测方法,其特征在于,所述步骤S4中的平衡蒸馏损失函数的表达式为:
10.一种采用权利要求1至9任意一项所述的一种基于平衡蒸馏的快速目标检测方法的目标检测装置,其特征在于,包括:
...【技术特征摘要】
1.一种基于平衡蒸馏的快速目标检测方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于平衡蒸馏的快速目标检测方法,其特征在于,所述大型教师模型和小型学生模型均由主干网络和头部网络构成,在模型训练前先加载大型教师模型的预训练权重,冻结大型教师模型的参数,初始化小型学生模型的权重。
3.如权利要求1所述的一种基于平衡蒸馏的快速目标检测方法,其特征在于,在步骤s2中:
4.如权利要求3所述的一种基于平衡蒸馏的快速目标检测方法,其特征在于,所述教师交并比分数或学生交并比分数的表达式为:
5.如权利要求4所述的一种基于平衡蒸馏的快速目标检测方法,其特征在于,所述教师中心偏离度或...
【专利技术属性】
技术研发人员:段桂芳,毛峥昱,刘振宇,谭建荣,
申请(专利权)人:余姚市机器人研究中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。