目标检测模型的训练方法、目标检测方法、装置及设备制造方法及图纸

技术编号:38871977 阅读:15 留言:0更新日期:2023-09-22 14:07
本公开提供了一种目标检测模型的训练方法、目标检测方法、装置及设备,涉及人工智能技术领域,具体涉及自动驾驶、智能交通和深度学习技术领域。具体实现方案为:采用教师检测模型对样本待检图像进行处理,得到样本物体的蒸馏特征和蒸馏结果;其中,所述蒸馏特征包括全局蒸馏特征和局部蒸馏特征;所述蒸馏结果包括二维蒸馏结果和三维蒸馏结果;根据所述样本待检图像、所述样本待检图像的监督数据、所述蒸馏特征和所述蒸馏结果,对学生检测模型进行训练,得到目标检测模型。通过上述技术方案,能够提高目标检测的精度。提高目标检测的精度。提高目标检测的精度。

【技术实现步骤摘要】
目标检测模型的训练方法、目标检测方法、装置及设备


[0001]本公开涉及人工智能
,尤其具体涉及自动驾驶、智能交通和深度学习


技术介绍

[0002]V2X(vehicle to vehicle,车对车的信息交换)车路协同技术,是解决单车智能局限性的一种有效方式。V2X通过在路侧部署传感器,提升路口复杂环境的感知能力,将障碍物信息发送给自动驾驶车辆,极大提升单车自动驾驶的安全性。
[0003]车路协同技术的实现依赖于路侧障碍物的准确检测。相关技术中基于雷达传感器采集的点云数据进行障碍物检测,虽检测精度高,但是检测范围有限,且成本高,不适合大规模部属和应用;基于相机采集的图像即将视觉检测中,轻量级网络模型检测精度较低,需要较重的网络模型才能达到路侧感知产品的要求,但是较重的模型性能低,实时性不佳,对计算资源的占用高,使得硬件成本增加。因此,亟需一种更有效且检测精度更高的障碍物检测方法。

技术实现思路

[0004]本公开提供了一种目标检测模型的训练方法、目标检测方法、装置及设备。
[0005]根据本公开的一方面,提供了一种目标检测模型的训练方法,该方法包括:
[0006]采用教师检测模型对样本待检图像进行处理,得到样本物体的蒸馏特征和蒸馏结果;其中,所述蒸馏特征包括全局蒸馏特征和局部蒸馏特征;所述蒸馏结果包括二维蒸馏结果和三维蒸馏结果;
[0007]根据所述样本待检图像、所述样本待检图像的监督数据、所述蒸馏特征和所述蒸馏结果,对学生检测模型进行训练,得到目标检测模型。
[0008]根据本公开的另一方面,提供了一种目标检测方法,该方法包括:
[0009]获取目标待检图像;
[0010]采用所述目标检测模型对所述目标待检图像进行处理,得到所述目标待检图像中目标物体的目标二维预测结果和目标三维预测结果;其中,所述目标检测模型通过本公开任一实施例所述的目标检测模型的训练方法训练得到。
[0011]根据本公开的另一方面,提供了一种目标检测模型的训练装置,该装置包括:
[0012]蒸馏信息确定模块,用于采用教师检测模型对样本待检图像进行处理,得到样本物体的蒸馏特征和蒸馏结果;其中,所述蒸馏特征包括全局蒸馏特征和局部蒸馏特征;所述蒸馏结果包括二维蒸馏结果和三维蒸馏结果;
[0013]模型训练模块,用于根据所述样本待检图像、所述样本待检图像的监督数据、所述蒸馏特征和所述蒸馏结果,对学生检测模型进行训练,得到目标检测模型。
[0014]根据本公开的另一方面,提供了一种目标检测装置,包括:
[0015]目标待检图像获取模块,用于获取目标待检图像;
[0016]目标预测结果确定模块,用于采用所述目标检测模型对所述目标待检图像进行处理,得到所述目标待检图像中目标物体的目标二维预测结果和目标三维预测结果;其中,所述目标检测模型通过本公开任一实施例所述的目标检测模型的训练方法训练得到。
[0017]根据本公开的另一方面,提供了一种电子设备,该电子设备包括:
[0018]至少一个处理器;以及
[0019]与所述至少一个处理器通信连接的存储器;其中,
[0020]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开任一实施例所述的目标检测模型的训练方法,或目标检测方法。
[0021]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行本公开任一实施例所述的目标检测模型的训练方法,或目标检测方法。
[0022]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开任一实施例所述的目标检测模型的训练方法,或目标检测方法。
[0023]根据本公开的技术,能够提高目标检测的精度。
[0024]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0025]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0026]图1是根据本公开实施例提供的一种目标检测模型的训练方法的流程图;
[0027]图2是根据本公开实施例提供的另一种目标检测模型的训练方法的流程图;
[0028]图3是根据本公开实施例提供的又一种目标检测模型的训练方法的流程图;
[0029]图4是根据本公开实施例提供的又一种目标检测模型的训练方法的流程图;
[0030]图5是根据本公开实施例提供的一种目标检测模型的训练过程的示意图;
[0031]图6是根据本公开实施例提供的一种目标检测方法的流程图;
[0032]图7是根据本公开实施例提供的一种目标检测模型的训练装置的结构示意图;
[0033]图8是根据本公开实施例提供的一种目标检测装置的结构示意图;
[0034]图9是用来实现本公开实施例的目标检测模型的训练方法或目标检测方法的电子设备的框图。
具体实施方式
[0035]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0036]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“教师”、“学生”、“目标”、“样本”等是用于区别类似的对象,而不必用于描述特定的顺
序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0037]此外,还需要说明的是,本专利技术的技术方案中,所涉及的样本待检图像和目标待检图像等的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0038]图1是根据本公开实施例提供的一种目标检测模型的训练方法的流程图。本实施例适用于自动驾驶或智能交通场景中如何高效且准确检测障碍物的情况。该方法可以由目标检测模型的训练装置来执行,该装置可以采用软件和/或硬件的方式实现,并可集成于承载目标检测模型的训练功能的电子设备中,比如服务器中。如图1所示,本实施例的目标检测模型的训练方法可以包括:
[0039]S101,采用教师检测模型对样本待检图像进行处理,得到样本物体的蒸馏本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测模型的训练方法,包括:采用教师检测模型对样本待检图像进行处理,得到样本物体的蒸馏特征和蒸馏结果;其中,所述蒸馏特征包括全局蒸馏特征和局部蒸馏特征;所述蒸馏结果包括二维蒸馏结果和三维蒸馏结果;根据所述样本待检图像、所述样本待检图像的监督数据、所述蒸馏特征和所述蒸馏结果,对学生检测模型进行训练,得到目标检测模型。2.根据权利要求1所述的方法,其中,所述教师检测模型包括教师骨干网络、教师二维检测网络和教师三维检测网络;其中,所述教师三维检测网络包括教师三维特征提取子网络和教师三维检测子网络。3.根据权利要求2所述的方法,其中,所述采用教师检测模型对样本待检图像进行处理,得到蒸馏特征和蒸馏结果,包括:采用所述教师骨干网络对所述样本待检图像进行特征提取,得到全局蒸馏特征;采用所述教师二维检测网络对所述全局蒸馏特征进行预测,得到所述样本物体的二维蒸馏结果;采用所述教师三维检测网络中教师三维特征提取子网络,根据所述二维蒸馏结果和所述全局蒸馏特征,确定所述样本物体的局部蒸馏特征;采用所述教师三维检测网络中教师三维检测子网络,对所述局部蒸馏特征进行预测,得到所述样本物体的三维蒸馏结果。4.根据权利要求1

3中任一项所述的方法,所述二维蒸馏结果包括教师类别信息和教师二维位置信息;所述三维蒸馏结果包括教师三维尺寸信息、教师朝向信息和教师三维位置信息。5.根据权利要求2所述的方法,其中,所述学生检测模型包括学生骨干网络、学生二维检测网络和学生三维检测网络;其中,所述学生骨干网络中的网络参数量小于所述教师骨干网络中的网络参数量;所述学生三维检测网络包括学生特征提取子网络和学生三维检测子网络。6.根据权利要求5所述的方法,其中,所述根据所述样本待检图像、所述样本待检图像的监督数据、所述蒸馏特征和所述蒸馏结果,对学生检测模型进行训练,包括:采用所述学生检测模型对所述样本待检图像进行处理,得到学生特征和学生预测结果;所述学生特征包括学生全局特征和学生局部特征;所述学生预测结果包括学生二维预测结果和学生三维预测结果;根据所述学生特征、所述学生预测结果、所述样本待检图像的监督数据、所述蒸馏特征和所述蒸馏结果,对所述学生检测模型进行训练。7.根据权利要求6所述的方法,其中,所述采用所述学生检测模型对所述样本待检图像进行处理,得到学生特征和学生预测结果,包括:采用所述学生骨干网络对所述样本待检图像进行特征提取,得到学生全局特征;采用所述学生二维检测网络对所述学生全局特征进行预测,得到所述样本物体的学生二维预测结果;采用所述学生三维检测网络中的学生特征提取子网络,根据所述学生二维预测结果中预测位置和所述学生全局特征,确定所述样本物体的学生局部特征;
采用所述学生三维检测网络中的学生检测子网络,对所述学生局部特征进行预测,得到所述样本物体的学生三维预测结果。8.根据权利要求6所述的方法,其中,所述根据所述学生特征、所述学生预测结果、所述样本待检图像的监督数据、所述蒸馏特征和所述蒸馏结果,对所述学生检测模型进行训练,包括:根据所述蒸馏特征、所述蒸馏结果、所述学生特征和所述学生预测结果,确定蒸馏损失;根据所述学生预测结果和所述样本物体的监督数据,确定监督损失;根据所述蒸馏损失和所述监督损失,确定训练损失;根据所述训练损失对所述学生检测模型进行训练,得到目标检测模型。9.根据权利要求8所述的方法,其中,所述根据所述蒸馏特征、所述蒸馏结果、所述学生特征和所述学生预测结果,确定蒸馏损失,包括:根据所述蒸馏特征和所述学生特征,确定特征蒸馏损失;根据所述蒸馏结果和所述学生预测结果,确定结果蒸馏损失;根据所述特征蒸馏损失和所述结果蒸馏损失,确定蒸馏损失。10.根据权利要求9所述的方法,其中,所述根据所述蒸馏特征和所述学生特征,确定特征蒸馏损失,包括:根据所述全局蒸馏特征和所述学生全局特征,确定第一特征蒸馏损失;根据所述局部蒸馏特征和所述学生局部特征,确定第二特征蒸馏损失;根据所述第一特征蒸馏损失和所述第二特征蒸馏损失,确定特征蒸馏损失。11.根据权利要求9所述的方法,其中,所述根据所述蒸馏结果和所述学生预测结果,确定结果蒸馏损失,包括:根据所述二维蒸馏结果和所述学生二维预测结果,确定第一结果蒸馏损失;根据所述三维蒸馏结果和所述学生三维预测结果,确定第二结果蒸馏损失;根据所述第一结果蒸馏损失和所述第二结果蒸馏损失,确定结果蒸馏损失。12.根据权利要求11所述的方法,其中,所述学生二维预测结果包括学生类别信息和学生二维位置信息;所述学生三维预测结果包括学生三维尺寸信息、学生朝向信息和学生三维位置信息。13.根据权利要求2所述的方法,其中,所述教师检测模型在所述学生检测模型训练前已经完成训练;所述教师检测模型中教师骨干网络的网络参数在所述教师检测模型在训练前先进行预训练。14.根据权利要求5所述的方法,还包括:对所述学生检测模型中学生骨干网络进行预训练。15.一种目标检测方法,包括:获取目标待检图像;采用所述目标检测模型对所述目标待检图像进行处理,得到所述目标待检图像中目标物体的目标二维预测结果和目标三维预测结果;其中,所述目标检测模型通过权利要求1

14中任一项所述的目标检测模型的训练方法训练得到。16.一种目标检测模型的训练装置,包括:
蒸馏信息确定模块,用于采用教师检测模型对样本待检图像进行处理,得到样本物体的蒸馏特征和蒸馏结果;其中,所述蒸馏特征包括全局蒸馏特征和局部蒸馏特征;所述蒸馏结果包括二维蒸馏结果和三维蒸馏结果;模型训练模块,用于根据所述样本待检图像、所述样本待检图像的监督数据、所述蒸馏特征和所述蒸馏结果,对学生检测模型进行...

【专利技术属性】
技术研发人员:舒茂
申请(专利权)人:阿波罗智行科技广州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1