目标检测模型训练方法、设备及计算机可读存储介质技术

技术编号:35816565 阅读:15 留言:0更新日期:2022-12-03 13:40
本申请公开了一种基于知识蒸馏的目标检测模型训练方法、设备及计算机可读存储介质。该方法包括:获取样本图像,样本图像包括用于对若干个目标进行检测的若干个正类锚框;分别利用目标检测学生模型和目标检测教师模型对样本图像进行目标检测,对应得到第一目标检测结果和第二目标检测结果;基于第一概率分布和第二概率分布之间的差异,构建第一蒸馏损失;至少基于第一蒸馏损失,调整目标检测学生模型的参数,蒸馏损失包括第一蒸馏损失。通过上述方式,能够提高训练得到的目标检测学生模型的目标检测能力。目标检测能力。目标检测能力。

【技术实现步骤摘要】
目标检测模型训练方法、设备及计算机可读存储介质


[0001]本申请涉及图像处理
,特别是涉及一种基于知识蒸馏的目标检测模型训练方法、设备及计算机可读存储介质。

技术介绍

[0002]目标检测技术被广泛应用于监控领域,例如应用于行人检测、车辆检测、车牌检测、交通标志检测等等。目前,大多目标检测方法依据目标检测模型实现。相对于小的目标检测模型,大的目标检测模型的检测精度高,但是不管是训练还是应用,均需要更多的存储及计算开销。
[0003]将知识蒸馏应用于目标检测模型的训练,能够解决上述问题,以更小的存储及计算开销,得到更好的检测精度。具体来说,知识蒸馏是利用训练好大的目标检测模型(目标检测教师模型)学习到的知识,去训练小的目标检测模型(目标检测学生模型),从而将目标检测教师模型学习到的知识传递到目标检测学生模型的网络结构中,最后将目标检测学生模型投入应用。但是,目前的基于知识蒸馏的目标检测模型训练方法,得到的目标检测学生模型的目标检测能力不够高。

技术实现思路

[0004]本申请提供一种基于知识蒸馏的目标检测模型训练方法、设备及计算机可读存储介质,能够解决目前的基于知识蒸馏的目标检测模型训练方法,得到的目标检测学生模型的目标检测能力不够高的问题。
[0005]为解决上述技术问题,本申请采用的一个技术方案是:提供一种基于知识蒸馏的目标检测模型训练方法。该方法包括:获取样本图像,样本图像包括用于对若干个目标进行检测的若干个正类锚框;分别利用目标检测学生模型和目标检测教师模型对样本图像进行目标检测,对应得到第一目标检测结果和第二目标检测结果,第一目标检测结果和第二目标检测结果包括各正类锚框为前景框的概率;基于第一概率分布和第二概率分布之间的差异,构建第一蒸馏损失,第一概率分布表征第一目标检测结果中各正类锚框为前景框的概率的分布特征,第二概率分布表征第二目标检测结果中各正类锚框为前景框的概率的分布特征;至少基于第一蒸馏损失,调整目标检测学生模型的参数。
[0006]为解决上述技术问题,本申请采用的另一个技术方案是:提供一种目标检测模型训练设备,该目标检测模型训练设备包括处理器、与处理器连接的存储器,其中,存储器存储有程序指令;处理器用于执行存储器存储的程序指令以实现上述方法。
[0007]为解决上述技术问题,本申请采用的又一个技术方案是:提供一种计算机可读存储介质,存储有程序指令,该程序指令被执行时能够实现上述方法。
[0008]通过上述方式,本申请将目标检测教师模型得到的第二目标检测结果中各正类锚框为前景框的概率的分布特征(第二概率分布)作为新的知识,通过第一蒸馏损失传递给目标检测学生模型。从而能够使得目标检测学生模型在知识蒸馏过程,学习到目标检测教师
模型得到的正类锚框排序,在相关技术中知识蒸馏的基础上,提高训练得到的目标检测学生模型的目标检测能力。
附图说明
[0009]图1是本申请基于知识蒸馏的目标检测模型训练方法一实施例的流程示意图;
[0010]图2是目标检测学生模型及目标检测教师模型对目标A的目标检测结果的一示意图;
[0011]图3是本申请基于知识蒸馏的目标检测模型训练方法另一实施例的流程示意图;
[0012]图4是图3中S22的具体流程示意图;
[0013]图5是本申请目标检测模型训练设备一实施例的结构示意图;
[0014]图6是本申请计算机可读存储介质一实施例的结构示意图。
具体实施方式
[0015]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0016]本申请中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0017]在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,在不冲突的情况下,本文所描述的实施例可以与其它实施例相结合。
[0018]图1是本申请基于知识蒸馏的目标检测模型训练方法一实施例的流程示意图。需注意的是,若有实质上相同的结果,本实施例并不以图1所示的流程顺序为限。如图1所示,本实施例可以包括:
[0019]S11:获取样本图像。
[0020]样本图像包括用于对若干个目标进行检测的若干个正类锚框。
[0021]本实施例的执行主体是目标检测模型训练设备,该目标检测模型训练设备可以是任何有目标检测模型训练能力的电子设备,如手机、电脑,还可以是服务器等等。
[0022]样本图像可以标注有真实目标检测结果,真实目标检测结果可以包括正类锚框为前景框的真实概率、正类锚框中目标的真实边界框(ground

truth bounding box),样本图像还可以标注有各个目标的区域、前景区域和背景区域等等。目标可以是任何具有检测需求的对象,例如人、车、动物(如猫、狗)等等。锚框(anchor box)是根据目标预先定义的先验框。在获取样本图像包括的各个锚框之后,可以基于获取的各个锚框与目标的真实边界框之间的相似度,从样本图像包括的各个锚框中确定出正类锚框;具体地,可以但不局限于获取各个锚框与目标的真实边界框之间的相似度,将相似度大于相似度阈值的锚框确定为用
于检测目标的正类锚框(positive anchor)。相似度可以通过IOU、GIOU、DIOU、CIOU等指标衡量。后文也将用于检测目标的正类锚框称为目标对应的正类锚框。
[0023]S12:分别利用目标检测学生模型和目标检测教师模型对样本图像进行目标检测,对应得到第一目标检测结果和第二目标检测结果。
[0024]第一目标检测结果和第二目标检测结果均包括各正类锚框为前景框的概率。
[0025]目标检测教师模型大于目标检测学生模型,即相较于目标检测教师网络,目标检测学生模型的网络结构更简单(参数量更小、更轻量级),需要的存储及计算开销更小。例如,教师模型为ResNet50

RetinaNet,ResNet18

RetinaNet。
[0026]正类锚框为前景框的概率也可以称为正类锚框的置信度,与正类锚框的质量正相关。第一目标检测结果和第二目标检测结果还可以包括各正类锚框为前景框的概率,各正类锚框中目标的预测边界框、样本图像中各个像素点的目标分类结果等等。后文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识蒸馏的目标检测模型训练方法,其特征在于,包括:获取样本图像,所述样本图像包括用于对若干个目标进行检测的若干个正类锚框;分别利用目标检测学生模型和目标检测教师模型对所述样本图像进行目标检测,对应得到第一目标检测结果和第二目标检测结果,所述第一目标检测结果和所述第二目标检测结果包括各所述正类锚框为前景框的概率;基于第一概率分布和第二概率分布之间的差异,构建第一蒸馏损失,所述第一概率分布表征所述第一目标检测结果中各所述正类锚框为前景框的概率的分布特征,所述第二概率分布表征所述第二目标检测结果中各所述正类锚框为前景框的概率的分布特征;至少基于所述第一蒸馏损失,调整所述目标检测学生模型的参数。2.根据权利要求1所述的方法,其特征在于,在所述基于第一概率分布和第二概率分布之间的差异,构建第一蒸馏损失之前,还包括:对所述第一目标检测结果中各所述正类锚框为前景框的概率进行整合,整合后的所述第一目标检测结果中各所述正类锚框为前景框的概率处在预设的概率范围;将整合后的所述第一目标检测结果中各所述正类锚框为前景框的概率的分布特征,确定为所述第一概率分布。3.根据权利要求1所述的方法,其特征在于,在所述基于第一概率分布和第二概率分布之间的差异,构建第一蒸馏损失之前,还包括:对所述第二目标检测结果中各所述正类锚框为前景框的概率进行整合,整合后的所述第二目标检测结果中各所述正类锚框为前景框的概率处在预设的概率范围;将整合后的所述第二目标检测结果中各所述正类锚框为前景框的概率的分布特征,确定为所述第二概率分布。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:分别利用所述目标检测学生模型和所述目标检测教师模型对所述样本图像进行特征提取,对应得到第一特征图和第二特征图;获取所述第一特征图和所述第二特征图之间各个像素点的特征差异值,所述像素点的特征差异值为所述像素点在所述第一特征图中的特征与在所述第二特征图中的特征之间的差异值;获取各个所述像素点的权重;基于各个所述像素点的权重对各个所述像素点的特征差异值进行加权处理,得到加权处理结果;基于所述加权处理结果构建第二蒸馏损失;所述至少基于所述第一蒸馏损失,调整所述目标检测学生模型的参数,包括:基于所述第一蒸馏损失和所述第二蒸馏损失,调整所述目标检测学生模型的参数。5.根据权利要求4所述的方法,其特征在于,所述获取各个所述像素点的权重,包括:基于各个所述像素点在所述样本图像中的区域,获取各个所述像素点的第一权重影响值;其中,所述像素点的权重与所述像素点的第一权重影响值正相关,前景区域的像素点的第一权重影响值大于背景区域的像素点的第一权重影响值;至少基于各个所述像素点的第一权重影响值,获取各个所述像素点的权重。6.根据权利要求5所述的方法,其特征在于,所述第一目标检测结果包括所述第一特征
图中各...

【专利技术属性】
技术研发人员:程博刘天赐邵明
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1