一种自动驾驶3D目标检测方法及相关装置制造方法及图纸

技术编号：37860288 阅读：12 留言：0更新日期：2023-06-15 20:50

本申请提供一种自动驾驶3D目标检测方法及相关装置，该方法包括：使用深度估计网络模型对多视角图像的图像特征进行深度点云预测，获得当前时刻的点云数据；根据多视角图像的相机参数从多视角图像的图像特征中提取出上下文特征，并对上下文特征和当前时刻的点云数据进行外积操作和体素池化操作；将获得的当前时刻的鸟瞰图特征和过去时刻的鸟瞰图特征进行融合；使用融合后的鸟瞰图特征进行3D目标检测。通过深度估计网络模型预测出的点云数据获得的鸟瞰图特征来进行3D目标检测，能够有效利用目标对象的三维信息建模的先验信息来深度监督模型的训练过程，从而提高了自动驾驶的应用场景中的目标检测精度。用场景中的目标检测精度。用场景中的目标检测精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种自动驾驶3D目标检测方法及相关装置

[0001]本申请涉及自动驾驶、深度学习、时序融合和3D目标检测的
，具体而言，涉及一种自动驾驶3D目标检测方法及相关装置。

技术介绍

[0002]目前，在自动驾驶的应用场景中，通常是使用已有的二维(2D)目标检测方法来从二维图像特征中预测出三维(3D)目标，具体例如：获取多相机采集的环境图像，并提取出环境图像中的图像特征，然后，使用目标检测模型对该图像特征进行目标对象(例如障碍物或行人等等)检测等等。在具体的实践过程中发现，由于目标检测模型是使用二维图像和二维标签训练的，所以该目标检测模型缺少三维(3D)的先验信息，导致自动驾驶的应用场景中的目标检测精度较低。

技术实现思路

[0003]本申请实施例的目的在于提供一种自动驾驶3D目标检测方法及相关装置，用于改善自动驾驶的应用场景中的目标检测精度较低的问题。
[0004]本申请实施例提供了一种自动驾驶3D目标检测方法，包括：获取自动驾驶场景中的当前时刻的多视角图像，并提取出多视角图像的图像特征；使用深度估计网络模型对多视角图像的图像特征进行深度点云预测，获得当前时刻的点云数据；根据多视角图像的相机参数从多视角图像的图像特征中提取出上下文特征，并对上下文特征和当前时刻的点云数据进行外积操作和体素池化操作，获得当前时刻的鸟瞰图特征；获取过去时刻的鸟瞰图特征，并将当前时刻的鸟瞰图特征和过去时刻的鸟瞰图特征进行融合，获得融合后的鸟瞰图特征；使用融合后的鸟瞰图特征进行3D目标检测。在上述方案的实现过程中，通过...

【技术保护点】

【技术特征摘要】
1.一种自动驾驶3D目标检测方法，其特征在于，包括：获取自动驾驶场景中的当前时刻的多视角图像，并提取出所述多视角图像的图像特征；使用深度估计网络模型对所述多视角图像的图像特征进行深度点云预测，获得所述当前时刻的点云数据；根据所述多视角图像的相机参数从所述多视角图像的图像特征中提取出上下文特征，并对所述上下文特征和所述当前时刻的点云数据进行外积操作和体素池化操作，获得所述当前时刻的鸟瞰图特征；获取过去时刻的鸟瞰图特征，并将所述当前时刻的鸟瞰图特征和所述过去时刻的鸟瞰图特征进行融合，获得融合后的鸟瞰图特征；使用所述融合后的鸟瞰图特征进行3D目标检测。2.根据权利要求1所述的方法，其特征在于，在所述使用深度估计网络模型对所述多视角图像的图像特征进行深度点云预测之前，还包括：获取不同视角拍摄的样本图像和样本标签，并提取出所述样本图像的图像特征和相机参数，所述样本图像是对目标对象采集的图像，所述样本标签是所述目标对象的三维点云数据；以所述图像特征和所述相机参数为训练数据，以所述样本标签为训练标签，对深度估计神经网络进行训练，获得所述深度估计网络模型。3.根据权利要求1所述的方法，其特征在于，所述相机参数包括：内部参数和外部参数；所述根据所述多视角图像的相机参数从所述多视角图像的图像特征中提取出上下文特征，包括：将所述内部参数和所述外部参数进行展平和拼接，获得参数输入向量，并将所述参数输入向量扩展为多维向量；使用所述多维向量对所述图像特征进行加权融合，获得所述上下文特征。4.根据权利要求1所述的方法，其特征在于，所述对所述上下文特征和所述当前时刻的点云数据进行外积操作和体素池化操作，包括：获取过去时刻的点云数据，将所述过去时刻的点云数据与所述当前时刻的点云数据进行对齐，获得对齐点云数据；对所述上下文特征和所述对齐点云数据进行外积操作和体素池化操作。5.根据权利要求4所述的方法，其特征在于，所述将所述过去时刻的点云数据与所述当前时刻的点云数据进行对齐，包括：将所述过去时刻的点云数据的...

【专利技术属性】
技术研发人员：郝坤坤，黄浴，潘余曦，杨子江，
申请(专利权)人：西安深信科创信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人