本公开实施例公开了一种目标场景下多目标检测方法,包括:获取目标场景下的特征图像,所述特征图像包含至少一待检测目标;基于训练后的第一神经网络对所述特征图像进行处理,获得目标位置坐标处的包围框的尺寸,根据所述包围框的尺寸确定所述特征图像在所述目标位置坐标处对应的anchors尺寸;其中,所述第一神经网络的训练样本包括所述目标场景下所述至少一待检测目标在特征图像中的位置坐标和所述位置坐标对应的包围框尺寸。本公开实施例还进一步公开了一种目标场景下多目标检测装置、计算机设备、车辆和存储介质。
【技术实现步骤摘要】
多目标检测方法、装置、计算机设备、车辆和存储介质
本公开实施例涉及目标检测领域,尤其涉及一种目标场景下多目标检测方法、装置、智能驾驶车辆和存储介质。
技术介绍
目前,基于深度学习的目标检测方法在进行物体检测的过程中,为了更加准确地确定真实目标的位置和类别,大多需要使用预选框(priorbox),也称锚框(anchorbox,anchors)。anchors的尺寸设置对目标检测性能的影响非常大。通常情况下,为了兼顾图像的所有位置,通常的目标检测算法都会设置固定的anchors,会将固定的anchors均匀的分布在整张图像上,以便覆盖所有可能出现的目标。但是,对于驾驶场景中的目标,比如车辆、行人等,根据相机的成像原理,目标会呈现“近大远小”的特点,在这种情况下,上述anchors设置难以很好的匹配到所有的目标,从而导致网络训练的时候真实目标和anchors的交并比过小,使得网络难以正确的对目标进行分类与回归,影响目标检测的准确率。如果设置更多的anchors,又会由于能够匹配到真实目标的很少,大部分的anchors被扔掉,浪费计算资源且耗时较长,导致检测效率低下。
技术实现思路
为解决现有存在的技术问题,本公开实施例提供一种高效精确的目标场景下多目标检测方法、装置、驾驶场景下多目标检测方法、智能驾驶车辆和存储介质。为达到上述目的,本公开实施例的技术方案是这样实现的:第一方面,本公开实施例提供一种目标场景下多目标检测方法,所述方法包括:获取目标场景下的特征图像,所述特征图像包含至少一待检测目标;基于训练后的第一神经网络对所述特征图像进行处理,获得目标位置坐标处的包围框的尺寸,根据包围框的尺寸确定所述特征图像在目标位置坐标处对应的anchors尺寸;其中,所述第一神经网络的训练样本包括所述目标场景下所述至少一待检测目标在特征图像中的位置坐标和所述位置坐标对应的包围框尺寸。其中,所述方法还包括:将所述anchors的尺寸作为目标检测网络在所述目标位置坐标处对应的anchors设置参数,基于训练后的所述目标检测网络提取所述anchors分别对应的图像特征进行检测,获得所述anchors对应的所述至少一待检测目标的类别和位置。其中,所述获得目标位置坐标处的包围框的尺寸,根据所述包围框的尺寸确定所述特征图像在所述目标位置坐标处对应的anchors尺寸,包括:获取所述特征图像在目标位置坐标处的包围框尺寸;将所述包围框的尺寸乘以特征层对应的缩放系数获得所述特征图像在所述目标位置坐标处对应的anchors尺寸。其中,在所述基于训练后的第一神经网络对所述特征图像进行处理之前,还包括:获取第一训练样本;其中,所述第一训练样本中包括所述目标场景下采集的样本图像以及所述样本图像中包含的不同位置的目标的包围框标注,所述包围框标注通过对所述包围框的位置坐标和尺寸进行标注获取;将所述第一训练样本输入初始的第一神经网络模型进行迭代训练,直至所述神经网络模型的第一损失函数满足收敛条件,得到所述训练后的第一神经网络。其中,所述包围框标注通过对所述包围框的位置坐标和尺寸进行标注获取,包括:对所述包围框的中心坐标、宽度尺寸和高度尺寸进行标注,获得所述包围框标注。其中,所述将所述第一训练样本输入初始的第一神经网络模型进行迭代训练,直至所述神经网络模型的第一损失函数满足收敛条件,包括:将所述第一训练样本输入初始的第一神经网络模型进行迭代训练,直至所述神经网络模型输出的针对所述样本图像目标位置坐标对应的anchors的尺寸预测值与真实值之间的均方误差在设置的阈值范围内,则第一损失函数满足收敛条件。第二方面,本公开实施例还提供一种目标场景下多目标检测装置,所述装置包括获取模块和处理模块,其中,所述获取模块,用于获取目标场景下的特征图像,所述特征图像包含至少一待检测目标;所述处理模块,用于基于训练后的第一神经网络对所述特征图像进行处理,获得目标位置坐标处的包围框的尺寸,根据所述包围框的尺寸确定所述特征图像在所述目标位置坐标处对应的anchors的尺寸;其中,所述第一神经网络的训练样本包括所述目标场景下所述至少一待检测目标在特征图像中的位置坐标和对应的包围框尺寸。第三方面,本公开实施例还提供一种计算机设备,所述计算机设备包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,所述处理器用于运行所述计算机程序时,实现本公开任一实施例所述的目标场景下多目标检测方法。第四方面,本公开实施例还提供一种智能驾驶车辆,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器;其中,所述处理器用于运行所述计算机程序时,实现如本公开任一实施例所述的目标场景下多目标检测方法。第五方面,本公开实施例还提供一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如本公开任一实施例所述的目标场景下多目标检测方法、或执行时实现如本公开任一实施例所述的目标场景下多目标检测方法。本公开实施例中,通过获取目标场景下的特征图像,所述特征图像包含至少一待检测目标;目标场景下对应的特征图像包含的检测目标大小在所述特征图像中的位置会呈规律分布;基于训练后的第一神经网络对所述特征图像进行处理,获得目标位置坐标处的包围框的尺寸,根据所述包围框的尺寸确定所述特征图像在目标位置坐标处对应的anchors的尺寸;其中,所述第一神经网络的训练样本包括所述目标场景下所述至少一待检测目标在特征图像中的位置坐标和所述位置坐标对应的包围框尺寸,这里,基于训练后的第一神经网络对所述特征图像进行处理,获得目标位置坐标处的包围框的尺寸,即对所述目标位置坐标处的包围框的尺寸进行预测,然后,基于所述包围框的尺寸确定所述特征图像在所述目标位置坐标处对应的anchors的尺寸,即确定特征图像在目标位置坐标相适应大小的anchors的尺寸,由于能够根据待检测目标的位置获得准确的anchors尺寸,就不需要预先在不同位置设置大量固定尺寸的anchors,anchors的尺寸与待检测目标的大小会相适应,可以降低拟合的难度,节省计算资源,检测结果会更加准确。附图说明图1为本公开一实施例提供的一种目标场景下多目标检测方法的流程示意图;图2为本公开一实施例提供的针对RefineDet网络中间结果对应的特征图像进行处理的示意图;图3为本公开一实施例提供的特征图像下建立的三维坐标系的示意图;图4为本公开一实施例提供的特征图像在三维坐标系下的位置坐标与尺寸的分布示意图;图5为本公开一实施例提供的特征图像在横轴上的位置坐标与尺寸的分布示意图;图6为本公开一实施例提供的特征图像在纵轴上的位置坐标与尺寸的分布示意图;图7为本公开另一实施例提供的一种目标场景下多目标检测方法的流程示意图;图8为本公开另一实施例提供的一种目标场景下多目标检测方法的流程示意图;图9为本公开另一实施例提供的一种目标场景下多目标检测方法的流程示意图;图10为本本文档来自技高网...
【技术保护点】
1.一种目标场景下多目标检测方法,其特征在于,包括:/n获取目标场景下的特征图像,所述特征图像包含至少一待检测目标;基于训练后的第一神经网络对所述特征图像进行处理,获得目标位置坐标处的包围框的尺寸,根据所述包围框的尺寸确定所述特征图像在所述目标位置坐标处对应的anchors尺寸;其中,所述第一神经网络的训练样本包括所述目标场景下所述至少一待检测目标在特征图像中的位置坐标和所述位置坐标对应的包围框尺寸。/n
【技术特征摘要】
1.一种目标场景下多目标检测方法,其特征在于,包括:
获取目标场景下的特征图像,所述特征图像包含至少一待检测目标;基于训练后的第一神经网络对所述特征图像进行处理,获得目标位置坐标处的包围框的尺寸,根据所述包围框的尺寸确定所述特征图像在所述目标位置坐标处对应的anchors尺寸;其中,所述第一神经网络的训练样本包括所述目标场景下所述至少一待检测目标在特征图像中的位置坐标和所述位置坐标对应的包围框尺寸。
2.根据权利要求1所述的目标场景下多目标检测方法,其特征在于,还包括:
将所述anchors的尺寸作为目标检测网络在所述目标位置坐标处对应的anchors设置参数;
基于所述目标检测网络提取所述anchors分别对应的图像特征进行检测,获得所述anchors对应的所述至少一待检测目标的类别和位置。
3.根据权利要求1所述的目标场景下多目标检测方法,其特征在于,所述获得目标位置坐标处的包围框的尺寸,根据所述包围框的尺寸确定所述特征图像在所述目标位置坐标处对应的anchors尺寸,包括:
获取所述特征图像在目标位置坐标处的包围框尺寸;
将所述包围框的尺寸乘以特征层对应的缩放系数获得所述特征图像在所述目标位置坐标处对应的anchors尺寸。
4.根据权利要求1所述的目标场景下多目标检测方法,其特征在于,在所述基于训练后的第一神经网络对所述特征图像进行处理之前,还包括:
获取第一训练样本;其中,所述第一训练样本中包括所述目标场景下采集的样本图像以及所述样本图像中包含的不同位置的目标的包围框标注,所述包围框标注通过对所述包围框的位置坐标和尺寸进行标注获取;
将所述第一训练样本输入初始的第一神经网络模型进行迭代训练,直至所述神经网络模型的第一损失函数满足收敛条件,得到所述训练后的第一神经网络。
5.根据权利要求4所述的目标场景下多目标检测方法,...
【专利技术属性】
技术研发人员:张书豪,谢伟,连春燕,胡荣东,
申请(专利权)人:长沙智能驾驶研究院有限公司,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。