System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 检测模型蒸馏方法、目标检测方法、装置及电子设备制造方法及图纸_技高网

检测模型蒸馏方法、目标检测方法、装置及电子设备制造方法及图纸

技术编号:40497987 阅读:9 留言:0更新日期:2024-02-26 19:26
本申请公开一种检测模型蒸馏方法、目标检测方法、装置及电子设备,涉及机器学习技术领域,用于训练出精度更高的学生模型,得到更好的目标检测结果。该方法包括:将样本图像分别输入教师模型和学生模型,从教师模型对样本图像进行处理后输出的识别结果中筛选出教师正样本识别结果;对于每个教师正样本识别结果,从学生模型对样本图像进行处理后预设的多个锚框中确定与教师正样本识别结果匹配的目标锚框;对每对相匹配的教师正样本识别结果和目标锚框进行逻辑输出蒸馏,得到逻辑输出蒸馏损失;基于识别结果真值,确定检测任务损失;基于逻辑输出蒸馏损失,以及检测任务损失,对学生模型进行训练,得到训练后的学生模型。

【技术实现步骤摘要】

本申请涉及机器学习,尤其涉及一种检测模型蒸馏方法、目标检测方法、装置及电子设备


技术介绍

1、目标检测的任务是找出图像中的目标,确定它们的位置和类别。实现目标检测的途径通常是训练出检测模型并通过训练好的检测模型实现目标检测功能。模型通常会随着模型精度的提高而越加复杂,占用的计算资源也会增加,难以将精度较高的模型存储在计算资源受限的设备中。

2、知识蒸馏是一种通过引入教师模型来诱导学生模型训练的模型压缩方法,已经训练好的教师模型提供知识,结构更为简单的学生模型通过知识蒸馏训练来获取教师模型的知识,从而实现将复杂模型的知识传递给参数量小、学习能力弱的模型,学生模型在保留教师模型精度的同时,满足计算资源受限的设备对模型存储和计算的要求。

3、但是目前通过知识蒸馏训练模型的方法中,教师模型输出的结果会传递给学生模型,其中存在大量无用信息,会限制学生模型学习教师模型的知识,导致训练出的学生模型精度不高,使用学生模型进行目标检测时也不能达到很好的目标检测效果。


技术实现思路

1、本申请提供一种检测模型蒸馏方法、目标检测方法、装置及电子设备,用于训练出精度更高的学生模型,以在使用训练好的学生模型进行目标检测时得到更精准的检测结果。

2、为实现上述技术目的,本申请采用如下技术方案:

3、第一方面,本申请提供一种检测模型蒸馏方法,包括:

4、获取训练好的教师模型、包含目标物体的样本图像,以及样本图像对应的目标物体的识别结果真值,教师模型用于输出对样本图像中目标物体的识别结果;

5、将样本图像分别输入至教师模型和学生模型中,对教师模型对样本图像进行处理后输出的识别结果进行筛选,得到教师正样本识别结果;

6、对于每个教师正样本识别结果,从学生模型对样本图像进行处理后预设的多个锚框中确定与教师正样本识别结果匹配的目标锚框;

7、对每个匹配组合进行逻辑输出蒸馏,得到逻辑输出蒸馏损失,逻辑输出蒸馏损失用于指示教师模型与学生模型在输出层的差异程度;一个匹配组合中包括一个教师正样本识别结果以及与教师正样本识别结果匹配的目标锚框;

8、基于识别结果真值,确定检测任务损失,检测任务损失用于指示学生模型对目标物体的识别结果与识别结果真值之间的差异程度;

9、基于逻辑输出蒸馏损失,以及检测任务损失,对学生模型进行训练,得到训练后的学生模型。

10、本申请提供的技术方案至少带来以下有益效果:通过对教师模型对样本图像进行处理后输出的识别结果进行筛选,得到教师正样本识别结果,教师模型输出的无用信息被筛除,进而从学生模型对样本图像进行处理后预设的多个锚框中确定与每个教师正样本识别结果匹配的目标锚框,对目标锚框以及与目标锚框匹配的教师正样本识别结果进行逻辑输出蒸馏时,学生模型可以一对一地、更有针对性地学习到教师模型的识别结果,无需学习教师模型输出的无用的识别结果,基于此训练过程得到的学生模型进行目标物体检测的精度、准度也更高,更能满足用户的使用需求。

11、在一种可能的实现方式中,教师正样本识别结果为教师正样本框;从学生模型对样本图像进行处理后预设的多个锚框中确定与教师正样本识别结果匹配的目标锚框,包括:对于每个锚框,确定锚框与教师正样本框的交并比;将交并比中的最大值指示的锚框确定为与教师正样本框匹配的目标锚框。

12、在一种可能的实现方式中,在对每个匹配组合进行逻辑输出蒸馏,得到逻辑输出蒸馏损失之前,该方法还包括:

13、在一种可能的实现方式中,基于识别结果真值,对教师正样本识别结果进行修正,得到修正后的教师正样本识别结果;基于识别结果真值,确定检测任务损失,包括:将样本图像中修正后的教师正样本识别结果标识且识别结果真值未标识的区域确定为非处理区域,非处理区域用于指示学生模型不对非处理区域进行目标物体识别;基于识别结果真值,以及样本图像中的非处理区域,得到检测任务损失。

14、在一种可能的实现方式中,教师正样本识别结果为教师正样本框及教师正样本框对应的教师正样本分类信息,识别结果真值为识别结果真值框和识别结果真值框对应的真值分类信息;基于识别结果真值,对教师正样本识别结果进行修正,得到修正后的教师正样本识别结果,包括:确定识别结果真值框和教师正样本框之间的交并比;删除教师正样本框中,交并比大于预设阈值,且教师正样本分类信息与真值分类信息不同的教师正样本框,得到修正后的教师正样本框。

15、在一种可能的实现方式中,一个目标锚框对应一个学生预测框和一个学生分类信息,学生预测框由学生模型基于目标锚框得到;对每个匹配组合进行逻辑输出蒸馏,得到逻辑输出蒸馏损失,包括:对于每个匹配组合,确定目标锚框对应的学生预测框与修正后的教师正样本框之间的定位损失,以及目标锚框对应的学生分类信息与修正后的教师正样本框对应的教师正样本分类信息之间的分类损失;定位损失用于指示教师模型与学生模型各自识别出的目标物体的位置之间的差异程度,分类损失用于指示教师模型与学生模型各自输出分类信息之间的差异程度;获取教师模型的前背景置信度信息,以及学生模型的前背景置信度信息,教师模型的前背景用于表征教师模型对样本图像进行处理后输出的除修正后的教师正样本框之外的区域,学生模型的前背景用于表征学生模型对样本图像进行处理后输出的除学生预测框之外的区域;基于教师模型的前背景置信度信息,以及学生模型的前背景置信度信息,确定教师模型的前背景与学生模型的前背景之间的置信度损失;基于定位损失、目标锚框对应的学生分类信息与修正后的教师正样本框对应的教师正样本分类信息之间的分类损失,以及教师模型的前背景与学生模型的前背景之间的置信度损失,确定逻辑输出蒸馏损失。

16、在一种可能的实现方式中,学生模型的特征层包括学生骨干网络和学生检测头,教师模型的特征层包括教师骨干网络和教师检测头;该方法还包括:在教师检测头与学生检测头结构相同时,用教师骨干网络对学生骨干网络进行特征蒸馏,并用教师检测头对学生检测头进行特征蒸馏,得到特征蒸馏损失,学生骨干网络用于从样本图像中提取特征信息并传输给学生检测头,学生检测头用于从特征信息中检测目标物体以及目标物体的分类信息;特征蒸馏损失用于指示教师模型与学生模型在特征层的差异程度;在教师检测头与学生检测头结构不相同时,用教师骨干网络对学生骨干网络进行特征蒸馏,并用教师检测头对辅助检测头进行特征蒸馏,得到特征蒸馏损失,辅助检测头与教师检测头结构相同,学生骨干网络还用于将特征信息传输给辅助检测头;基于逻辑输出蒸馏损失,以及检测任务损失,对学生模型进行训练,得到训练后的学生模型,包括:基于特征蒸馏损失、逻辑输出蒸馏损失,以及检测任务损失,对学生模型进行训练,得到训练后的学生模型。

17、第二方面,本申请提供一种目标检测方法,包括:

18、获取待检测图像;

19、将待检测图像输入至学生模型中,从待检测图像中识别出目标物体,学生模型基于第一方面所示的任意一种检测模型蒸本文档来自技高网...

【技术保护点】

1.一种检测模型蒸馏方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述教师正样本识别结果为教师正样本框;

3.根据权利要求1所述的方法,其特征在于,在所述对每个匹配组合进行逻辑输出蒸馏,得到逻辑输出蒸馏损失之前,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述教师正样本识别结果为教师正样本框及所述教师正样本框对应的教师正样本分类信息,所述识别结果真值为识别结果真值框和所述识别结果真值框对应的真值分类信息;

5.根据权利要求4所述的方法,其特征在于,一个所述目标锚框对应一个学生预测框和一个学生分类信息,所述学生预测框由所述学生模型基于所述目标锚框得到;

6.根据权利要求1-5任一项所述的方法,其特征在于,所述学生模型的特征层包括学生骨干网络和学生检测头,所述教师模型的特征层包括教师骨干网络和教师检测头;所述方法还包括:

7.一种目标检测方法,其特征在于,包括:

8.一种检测模型蒸馏装置,其特征在于,包括:

9.根据权利要求8所述的装置,其特征在于,</p>

10.一种目标检测装置,其特征在于,包括:

11.一种电子设备,其特征在于,包括:

12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机执行指令,当所述计算机执行指令在计算机上运行时,使得所述计算机执行权利要求1至6任一项所述的检测模型蒸馏方法,或权利要求7所述的目标检测方法。

...

【技术特征摘要】

1.一种检测模型蒸馏方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述教师正样本识别结果为教师正样本框;

3.根据权利要求1所述的方法,其特征在于,在所述对每个匹配组合进行逻辑输出蒸馏,得到逻辑输出蒸馏损失之前,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,所述教师正样本识别结果为教师正样本框及所述教师正样本框对应的教师正样本分类信息,所述识别结果真值为识别结果真值框和所述识别结果真值框对应的真值分类信息;

5.根据权利要求4所述的方法,其特征在于,一个所述目标锚框对应一个学生预测框和一个学生分类信息,所述学生预测框由所述学生模型基于所述目标锚框得到;

6.根据权...

【专利技术属性】
技术研发人员:黄心忆杨子伟李哲暘谭文明任烨
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1