单目3D目标检测的方法、系统、电子设备和存储介质技术方案

技术编号:39048480 阅读:12 留言:0更新日期:2023-10-10 12:01
本发明专利技术提供了单目3D目标检测的方法、系统、电子设备和存储介质,包括:通过预设的2D目标检测模型从待检测图像中获取包含待检测3D目标的2D图像区域,所述2D图像区域包括所述待检测3D目标的2D图像以及所述待检测3D目标的2D框,所述2D框内为所述待检测3D目标;对所述2D图像进行处理,获取所述待检测3D目标的目标参数,从而获得所述待检测3D目标的中心点坐标。通过对2D目标检测模型的选择,以及对3D目标检测模型的选择、对卷积的选取以及对分支的选取,实现了2D目标检测模型和3D目标检测模型参数的减少,实现了2D目标检测模型和3D目标检测模型的轻量化和准确性。测模型的轻量化和准确性。测模型的轻量化和准确性。

【技术实现步骤摘要】
单目3D目标检测的方法、系统、电子设备和存储介质


[0001]本专利技术属于目标检测领域,尤其涉及单目3D目标检测的方法、系统、电子设备和存储介质。

技术介绍

[0002]3D目标检测是自动驾驶领域的关键技术,检测的好坏直接影响着辅助驾驶的决策,进而3D目标检测是必须要研究的课题。常见的3D目标检测可分为三类:1、基于雷达,2、基于双目,3、基于单目。在此基础上也可以进行多模态的融合以期进一步提升检测的精度。但是在上述方案中基于单目的3D目标检测是成本最低的,这对于推动自动驾驶成本落地是非常关键的。
[0003]目前常见的单目3D目标检测主要有两种方法:
[0004]1、基于关键点检测的一步(one

stage)方法。
[0005]2、基于2D框的检测方法。
[0006]前者是将2D和3D检测融合到一起,利用目标的关键点来回归2D和3D信息。后者则是通过先检测出的2D信息,结合几何先验知识来推断3D信息。通常来说,前者方法的速度快于后者,但是由于结合了2D和3D检测,训练出来的模型强依赖于数据集和训练相机的内参,模型不具备数据集间的泛化性。后者分离了2D检测和3D检测可以很好地在不同数据集泛化,但是这种方法精度较低且不能实时的推理运行。

技术实现思路

[0007]本专利技术实施例的主要目的在于提供了单目3D目标检测的方法、系统、电子设备和存储介质,通过对2D目标检测模型的选择,以及对3D目标检测模型的选择、对卷积的选取以及对分支的选取,实现了2D目标检测模型和3D目标检测模型参数的减少,实现了2D目标检测模型和3D目标检测模型的轻量化和准确性。
[0008]第一方面,提供了单目3D目标检测的方法,所述方法包括:
[0009]通过预设的2D目标检测模型从待检测图像中获取包含待检测3D目标的2D图像区域,所述2D图像区域包括所述待检测3D目标的2D图像以及所述待检测3D目标的2D框,所述2D框内为所述待检测3D目标;
[0010]对所述2D图像进行处理,获取所述待检测3D目标的目标参数,从而获得所述待检测3D目标的中心点坐标。
[0011]在一个可能的实现方式中,所述对所述2D图像进行处理,获取所述待检测3D目标的目标参数,包括:
[0012]对所述2D图像进行训练和解析,获取训练后数组和解析参数,所述解析参数包括:置信度预测值、方向预测值、尺寸偏差和中心点坐标预测值;
[0013]通过预设的损失函数获取所述解析参数对应的损失值;
[0014]根据所述损失值和所述解析参数获取所述目标参数。
[0015]在另一个可能的实现方式中,所述目标参数包括:方向角、3D目标尺寸和3D目标中心点坐标。
[0016]在另一个可能的实现方式中,所述通过预设的损失函数获取所述解析参数对应的损失值,包括:
[0017]根据损失函数Loss
3D
=L
conf
+β1*L
ori
+β2*L
dim
+β3*L
loc
获取所述损失值,其中,Loss
3D
为3D目标检测的损失函数;L
conf
为置信度损失值、L
ori
为方向角预测值、L
dim
为预设目标尺寸、L
loc
为中心点坐标损失值,所述L
loc
=(p
i

p)2,其中,p
i
为所述中心点坐标预测值,p为所述3D目标中心点坐标,β1、β2与β3之和为1,β1、β2和β3分别为方向角预测值、预设目标尺寸和中心点坐标损失值的权重。
[0018]在另一个可能的实现方式中,所述根据所述损失值和所述解析参数获取所述目标参数,包括:
[0019]根据所述置信度预测值获取方向置信度;
[0020]根据所述方向置信度和所述方向角预测值获取所述方向角;
[0021]根据所述尺寸偏差和所述预设目标尺寸获取所述3D目标尺寸。
[0022]在另一个可能的实现方式中,根据所述方向角以及所述3D目标尺寸获得所述待检测3D目标中心点坐标。
[0023]在另一个可能的实现方式中,所述训练后数组的长度为12维,其中,所述方向置信度2维、所述方向角4维、所述3D目标尺寸和所述3D目标中心点坐标各3维。
[0024]第二方面,提供了单目3D目标检测的系统,所述系统包括:
[0025]获取模块,用于通过预设的2D目标检测模型从待检测图像中获取包含待检测3D目标的2D图像区域,所述2D图像区域包括所述待检测3D目标的2D图像以及所述待检测3D目标的2D框,所述2D框内为所述待检测3D目标;
[0026]中心点坐标获取模块,用于对所述2D图像进行处理,获取所述待检测3D目标的目标参数,从而获得所述待检测3D目标的中心点坐标。
[0027]第三方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现如第一方面提供的单目3D目标检测的方法。
[0028]第四方面,提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如第一方面提供的单目3D目标检测的方法。
附图说明
[0029]为了更清楚地说明本专利技术实施例中的技术方案,下面将对本专利技术实施例描述中所需要使用的附图作简单地介绍。
[0030]图1为本专利技术一个实施例提供的单目3D目标检测的方法的流程图;
[0031]图2为本专利技术再一个实施例提供的单目3D目标检测的方法的流程图;
[0032]图3为本专利技术一个实施例提供的单目3D目标检测的系统的结构图;
[0033]图4为本专利技术再一个实施例提供的单目3D目标检测的系统的结构图;
[0034]图5为本专利技术一种电子设备的实体结构示意图;图6为本专利技术一个实施例提供的单目3D目标检测方法的流程示意图。
[0035]具体实现方式
[0036]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。
[0037]本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本专利技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、模块和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、模块、组件和/或它们的组。应该理解,当我们称模块被“连接”或“耦接”到另一模块时,它可以直接连接或耦接到其他模块,或者也可以存在中间模块。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种单目3D目标检测的方法,其特征在于,所述方法包括:通过预设的2D目标检测模型从待检测图像中获取包含待检测3D目标的2D图像区域,所述2D图像区域包括所述待检测3D目标的2D图像以及所述待检测3D目标的2D框,所述2D框内为所述待检测3D目标;对所述2D图像进行处理,获取所述待检测3D目标的目标参数,从而获得所述待检测3D目标的中心点坐标。2.如权利要求1所述的方法,其特征在于,所述对所述2D图像进行处理,获取所述待检测3D目标的目标参数,包括:对所述2D图像进行训练和解析,获取训练后数组和解析参数,所述解析参数包括:置信度预测值、方向预测值、尺寸偏差和中心点坐标预测值;通过预设的损失函数获取所述解析参数对应的损失值;根据所述损失值和所述解析参数获取所述目标参数。3.如权利要求2所述的方法,其特征在于,所述目标参数包括:方向角、3D目标尺寸和3D目标中心点坐标。4.如权利要求2所述的方法,其特征在于,所述通过预设的损失函数获取所述解析参数对应的损失值,包括:根据损失函数Loss
3D
=L
conf
+β1*L
ori
+β2*L
dim
+β3*L
loc
获取所述损失值,其中,Loss
3D
为3D目标检测的损失函数、L
conf
为置信度损失值、L
ori
为方向角预测值、L
dim
为预设目标尺寸、L
loc
为中心点坐标损失值,所述L
loc
=(p
i

p)2,其中,...

【专利技术属性】
技术研发人员:黄立黄晟胡灏东田鹏张龙商长弘王鹏
申请(专利权)人:武汉轩辕智驾科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1