三维目标检测方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:37763966 阅读:12 留言:0更新日期:2023-06-06 13:22
本申请涉及一种三维目标检测方法、装置、计算机设备、存储介质和计算机程序产品。所述方法通过获取待检测图像,并通过预先训练的三维目标检测模型对待检测图像进行目标检测,得到候选目标的检测结果,进而根据检测结果中的不确定度以及分类置信度确定候选目标的目标置信度,由于该目标置信度可以表征候选目标所属类别和所在位置的综合可靠性,因此,实现了对候选目标的可靠性预测,提高了模型的检测性能。能。能。

【技术实现步骤摘要】
三维目标检测方法、装置、计算机设备和存储介质


[0001]本申请涉及目标检测
,特别是涉及一种三维目标检测方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]目标检测不仅需要识别出图像上存在的物体,给出对应的类别,还需要将该物体的位置通过最小包围框(Bounding box)的方式给出。随着目标检测技术的发展,基于点云的三维(3

Dimension,简称3D)目标检测算法在自动驾驶领域受到了广泛关注和应用。3D检测算法通常包括基于体素的检测方法和基于点的检测方法。其中,基于体素的检测方法首先将输入点云划分成规则的体素网格,然后对体素特征进行编码,再使用3D稀疏卷积神经网络对体素网格提取特征,输出特征经过密集化处理和2D骨干网络后通过检测头输出分类和回归结果(最小包围框即3D边界框的参数)。而基于点的检测方法会直接从原始点云中学习点的特征,不需要经过体素化等预处理操作。由于基于体素的检测方法具有高效的3D稀疏卷积,因此其实时性比较好,而基于点的检测方法由于是直接从原始点云提取特征,避免了结构化处理带来的信息损失,因此精度更高,但实时性较差。
[0003]传统技术中,为了满足实时性,工业界一般采用基于体素的检测方法用于3D点云的目标检测。3D目标检测通常会输出边界框的分类置信度以及定位的回归量,其中,定位的回归量一般包括三维中心点坐标、框的长宽高尺寸以及朝向角。
[0004]但是,目前的3D目标检测只能对边界框分类的置信度进行估计,而缺少对3D边界框定位的置信度进行估计,从而导致难以区分定位结果的可靠性。

技术实现思路

[0005]基于此,有必要针对上述目标检测定位结果的可靠性问题,提供一种能够衡量定位结果的可靠性的三维目标检测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0006]第一方面,本申请提供了一种三维目标检测方法。所述方法包括:
[0007]获取待检测图像;
[0008]通过预先训练的三维目标检测模型对所述待检测图像进行目标检测,得到候选目标的三维定位信息、所述三维定位信息的不确定度以及所述候选目标的分类置信度;
[0009]根据所述不确定度以及所述分类置信度确定所述候选目标的目标置信度,所述目标置信度用于表征所述候选目标所属类别和所在位置的综合可靠性。
[0010]在其中一个实施例中,所述三维目标检测模型的生成方法包括:获取待训练的三维目标检测模型,所述待训练的三维目标检测模型包括用于预测目标的三维定位信息的第一分支、用于预测所述三维定位信息的不确定度的第二分支以及用于预测所述目标的分类置信度的第三分支;将样本图像输入待训练的三维目标检测模型进行目标检测,得到所述第一分支预测的样本目标的三维定位信息、所述第二分支预测的所述三维定位信息的不确
定度以及所述第三分支预测的所述样本目标的分类置信度;根据预测的样本目标的三维定位信息、所述三维定位信息的不确定度以及所述样本目标的分类置信度,采用预设的不确定度回归损失函数和分类损失函数,对所述第一分支、所述第二分支和所述第三分支进行训练,直到收敛时得到训练后的所述三维目标检测模型。
[0011]在其中一个实施例中,所述第二分支采用平均值为第一目标值、标准差为第二目标值的高斯分布进行初始化。
[0012]在其中一个实施例中,所述样本图像包括所述样本目标的三维定位信息标签;所述预设的不确定度回归损失函数,根据所述样本图像中样本目标的三维定位信息标签、预测的所述样本图像中样本目标的三维定位信息、预测的所述三维定位信息的不确定度以及超参数确定。
[0013]在其中一个实施例中,所述方法还包括:根据所述样本图像中所述样本目标的三维定位信息标签、预测的所述样本目标的三维定位信息以及预测的所述三维定位信息的不确定度,确定第一损失项;根据预测的所述三维定位信息的不确定度以及所述超参数确定第二损失项;根据所述第一损失项和所述第二损失项,确定所述不确定度回归损失函数。
[0014][0015]在其中一个实施例中,所述根据所述不确定度以及所述分类置信度确定所述候选目标的目标置信度,包括:根据所述三维定位信息的不确定度以及预设的定位置信度,计算所述三维定位信息的目标定位置信度;获取所述目标定位置信度与所述分类置信度的乘积,将所述乘积确定为所述候选目标的目标置信度。
[0016]在其中一个实施例中,所述候选目标的三维定位信息包括所述候选目标的中心点坐标、所述候选目标的长、宽、高以及朝向角;所述三维定位信息的不确定度包括所述候选目标的中心点坐标、所述候选目标的长、宽、高以及朝向角分别对应的不确定度;所述根据所述三维定位信息的不确定度以及预设的定位置信度,计算所述三维定位信息的目标定位置信度,包括:获取所述候选目标的中心点坐标、所述候选目标的长、宽、高以及朝向角分别对应的不确定度的平均值;计算所述预设的定位置信度与所述平均值的差值,将所述差值确定为所述三维定位信息的目标定位置信度。
[0017]第二方面,本申请还提供了一种三维目标检测装置。所述装置包括:
[0018]待检测图像获取模块,用于获取待检测图像;
[0019]目标检测模块,用于通过预先训练的三维目标检测模型对所述待检测图像进行目标检测,得到候选目标的三维定位信息、所述三维定位信息的不确定度以及所述候选目标的分类置信度;
[0020]目标置信度确定模块,用于根据所述不确定度以及所述分类置信度确定所述候选目标的目标置信度,所述目标置信度用于表征所述候选目标所属类别和所在位置的综合可靠性。
[0021]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上第一方面所述方法的步骤。
[0022]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上第一方面所述方法的步
骤。
[0023]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上第一方面所述方法的步骤。
[0024]上述三维目标检测方法、装置、计算机设备、存储介质和计算机程序产品,通过获取待检测图像,并通过预先训练的三维目标检测模型对待检测图像进行目标检测,得到候选目标的检测结果,进而根据检测结果中的不确定度以及分类置信度确定候选目标的目标置信度,由于该目标置信度可以表征候选目标所属类别和所在位置的综合可靠性,因此,实现了对候选目标的可靠性预测,提高了模型的检测性能。
附图说明
[0025]图1为一个实施例中三维目标检测方法的流程示意图;
[0026]图2为一个实施例中三维目标检测模型的生成步骤的流程示意图;
[0027]图3为一个实施例中三维目标检测模型的训练原理示意图;
[0028]图4为一个实施例中确定本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种三维目标检测方法,其特征在于,所述方法包括:获取待检测图像;通过预先训练的三维目标检测模型对所述待检测图像进行目标检测,得到候选目标的三维定位信息、所述三维定位信息的不确定度以及所述候选目标的分类置信度;根据所述不确定度以及所述分类置信度确定所述候选目标的目标置信度,所述目标置信度用于表征所述候选目标所属类别和所在位置的综合可靠性。2.根据权利要求1所述的方法,其特征在于,所述三维目标检测模型的生成方法包括:获取待训练的三维目标检测模型,所述待训练的三维目标检测模型包括用于预测目标的三维定位信息的第一分支、用于预测所述三维定位信息的不确定度的第二分支以及用于预测所述目标的分类置信度的第三分支;将样本图像输入待训练的三维目标检测模型进行目标检测,得到所述第一分支预测的样本目标的三维定位信息、所述第二分支预测的所述三维定位信息的不确定度以及所述第三分支预测的所述样本目标的分类置信度;根据预测的样本目标的三维定位信息、所述三维定位信息的不确定度以及所述样本目标的分类置信度,采用预设的不确定度回归损失函数和分类损失函数,对所述第一分支、所述第二分支和所述第三分支进行训练,直到收敛时得到训练后的所述三维目标检测模型。3.根据权利要求2所述的方法,其特征在于,所述第二分支采用平均值为第一目标值、标准差为第二目标值的高斯分布进行初始化。4.根据权利要求2所述的方法,其特征在于,所述样本图像包括所述样本目标的三维定位信息标签;所述预设的不确定度回归损失函数,根据所述样本图像中样本目标的三维定位信息标签、预测的所述样本图像中样本目标的三维定位信息、预测的所述三维定位信息的不确定度以及超参数确定。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:根据所述样本图像中所述样本目标的三维定...

【专利技术属性】
技术研发人员:凌强周策何欣栋姚卯青
申请(专利权)人:安徽蔚来智驾科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1