三维目标检测方法、装置以及存储介质制造方法及图纸

技术编号：24093387 阅读：29 留言：0更新日期：2020-05-09 09:06

本公开提供了一种三维目标检测方法、装置以及存储介质，其中的方法包括：将目标物体在单目图像中的第一坐标中心，设置为3D边界框的第二坐标中心；根据外参和内参设置3D边界框的空间坐标约束，设置方向损失函数以及3D边界框的尺寸损失函数，并生成模型损失函数；使用单目图像训练样本并基于空间坐标约束和模型损失函数，对卷积神经网络模型进行训练，用以对单目图像进行三维目标检测处理。本公开的方法、装置、终端以及存储介质，通过设置空间坐标约束、方向损失函数以及尺寸损失函数，并对卷积神经网络模型进行训练构建多任务神经网络，能够实现对于单目图像的3D目标检测；可以提高三维目标检测的效率和精度，降低使用成本。

Three dimensional target detection method, device and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
三维目标检测方法、装置以及存储介质
本专利技术涉及图像处理
，尤其涉及一种三维目标检测方法、装置以及存储介质。
技术介绍
目标检测是计算机视觉领域的传统任务，与图像识别不同，目标检测不仅需要识别出图像上存在的物体，给出对应的类别，还需要将该物体的位置通过最小包围框(Boundingbox)的方式给出。目前，大多数3D物体检测方法依赖激光雷达数据，用以在自动驾驶场景中提供准确的深度信息，但是激光雷达成本高昂、视场范围比较小；单目相机安装复杂，成本低，但是，目前还没有基于单目视觉的3D目标检测技术方案。
技术实现思路
有鉴于此，本专利技术要解决的一个技术问题是提供一种三维目标检测方法、装置以及存储介质。根据本公开的一个方面，提供一种三维目标检测方法，包括：将目标物体在单目图像中的第一坐标中心，设置为所述目标物体的3D边界框的第二坐标中心；获取采集所述单目图像的单目相机的外参和内参，根据所述外参和内参设置所述目标物体的3D边界框的空间坐标约束；设置与所述目标物体的姿态角相对应的方向损失函数；基于与...

【技术保护点】
1.一种三维目标检测方法，包括：/n将目标物体在单目图像中的第一坐标中心，设置为所述目标物体的3D边界框的第二坐标中心；/n获取采集所述单目图像的单目相机的外参和内参，根据所述外参和内参设置所述目标物体的3D边界框的空间坐标约束；/n设置与所述目标物体的姿态角相对应的方向损失函数，基于与所述目标物体的平均尺寸、与所述平均尺寸相对应的估计残差，设置所述3D边界框的尺寸损失函数；/n根据所述方向损失函数和所述尺寸损失函数，生成预设的卷积神经网络模型的模型损失函数；/n使用单目图像训练样本并基于所述空间坐标约束和所述模型损失函数，对所述卷积神经网络模型进行训练，使用训练好的所述卷积神经网络模型对单目...

【技术特征摘要】
1.一种三维目标检测方法，包括：
将目标物体在单目图像中的第一坐标中心，设置为所述目标物体的3D边界框的第二坐标中心；
获取采集所述单目图像的单目相机的外参和内参，根据所述外参和内参设置所述目标物体的3D边界框的空间坐标约束；
设置与所述目标物体的姿态角相对应的方向损失函数，基于与所述目标物体的平均尺寸、与所述平均尺寸相对应的估计残差，设置所述3D边界框的尺寸损失函数；
根据所述方向损失函数和所述尺寸损失函数，生成预设的卷积神经网络模型的模型损失函数；
使用单目图像训练样本并基于所述空间坐标约束和所述模型损失函数，对所述卷积神经网络模型进行训练，使用训练好的所述卷积神经网络模型对单目图像进行三维目标检测处理。

2.如权利要求1所述的方法，所述根据所述外参和内参设置所述目标物体的3D边界框的空间坐标约束包括：
根据所述外参和内参确定与所述3D边界框顶点相对应的顶点三维坐标；
确定所述目标物体在所述单目图像中的2D边界框，基于所述2D边界框和所述顶点三维坐标生成所述空间坐标约束，以使每个顶点都能投影在所述2D边界框的至少一条边上。

3.如权利要求2所述的方法，还包括：
将与所述3D边界框相对应的三维坐标系设置为以第二坐标中心为原点的世界坐标系；
确定位于所述3D边界框上的点在所述三维坐标系中的三维坐标在所述单目图像中的投影坐标为：
x＝K[R|T]x0；
其中，所述三维坐标为x0＝[X,Y,Z,1]T，所述投影坐标为x＝[x,y,1]T；R为所述单目相机的旋转矩阵，T为所述单目相机的平移矩阵，K为所述单目相机的内参矩阵。

4.如权利要求2所述的方法，所述姿态角包括：方向角；所述设置与所述目标物体的姿态角相对应的方向损失函数包括：
将所述方向角映射到多个重叠的bin中；其中，所述卷积神经网络模型估计出所述方向角落在所述Bin中的概率，以及所述方向角的Cos和Sin值；
确定与所述bin相对应的置信损失和定位误差；
基于所述置信损失和定位误差获得所述方向损失函数。

5.如权利要求4所述的方法，其中，
所述方向损失函数为：
Ltheta＝Lconf+w*Lloc；
所述定位误差为：

其中，Lconf为所述bin的置信损失；Lloc为定位误差，nθ*为和所述方向角有覆盖的θ*角度的bin的个数，ci是第i个bin相对于单目相机中心的偏差角度，θ*为bin的中心角度，Δθi是第i个bin的中心需要的变化量，W为权重系数。

6.如权利要求5所述的方法，所述基于与所述目标物体的平均尺...

【专利技术属性】
技术研发人员：毛伟，裴积全，吕军，张凡，
申请(专利权)人：京东数字科技控股有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人