一种基于深度学习的3d目标检测办法制造技术

技术编号：36158140 阅读：8 留言：0更新日期：2022-12-31 20:05

本发明专利技术公开了一种基于深度学习的3d目标检测办法，对加载的训练样本图像进行预处理，计算目标的3d中心点，3d中心点在图像上的投影点，八个角点位置，目标中心点的高斯分布；构建深度学习卷积神经网络，包括主干网络和两个分支网络；加载数据集作为训练集，数据经过前向传播得到深度学习卷积神经网络的输出，计算损失度，反向传播，更新网络参数，得到训练好的神经网络模型；使用阶段，接收测试集图像数据，将图像送入预训练好的神经网络模型，得到输出相应的目标，计算每一个目标的3d位置及类别。本发明专利技术的3d目标的检测方法，用于自动驾驶中可以提高车辆对环境的感知能力。提高车辆对环境的感知能力。提高车辆对环境的感知能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的3d目标检测办法

[0001]本专利技术属于计算机视觉领域，尤其涉及一种基于深度学习的3d目标检测办法。

技术介绍

[0002]环境感知是自动驾驶中的重要任务，准确的感知直接影响到车辆的规划和控制，在环境感知中有基于激光雷达，单目摄像头，多目摄像头；摄像头由于成本低廉，成像稳定被大量使用。但是图像有其先天缺陷，缺乏目标的距离信息。近年来，2d检测技术不断完善成熟，为3d检测提供了有效的参考。
[0003]因此，本专利技术提出一种基于深度学习的3d目标检测办法。

技术实现思路

[0004]为解决现有技术中存在的不足，本专利技术的目的在于，提供一种基于深度学习的3d目标检测办法。
[0005]为实现本专利技术的目的，本专利技术所采用的技术方案是：
[0006]一种基于深度学习的3d目标检测办法，包括步骤：
[0007](1)加载kitti数据集作为训练样本图像，对加载的训练样本图像进行预处理，计算目标的3d中心点，3d中心点在图像上的投影点，八个角点位置，目标中心点的高斯分布；
[0008](2)构建深度学习卷积神经网络，包括主干网络和两个分支网络；
[0009](3)加载数据集作为训练集，数据经过前向传播得到深度学习卷积神经网络的输出，计算损失度，反向传播，更新网络参数，得到训练好的神经网络模型；
[0010](4)使用阶段，接收测试集图像数据，将图像送入预训练好的神经网络模型，得到输出相应的目标，计算每一个目标的3d位置及类别。...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的3d目标检测办法，其特征在于，包括步骤：(1)加载kitti数据集作为训练样本图像，对加载的训练样本图像进行预处理，计算目标的3d中心点，3d中心点在图像上的投影点，八个角点位置，目标中心点的高斯分布；(2)构建深度学习卷积神经网络，包括主干网络和两个分支网络；(3)加载数据集作为训练集，数据经过前向传播得到深度学习卷积神经网络的输出，计算损失度，反向传播，更新网络参数，得到训练好的神经网络模型；(4)使用阶段，接收测试集图像数据，将图像送入预训练好的神经网络模型，得到输出相应的目标，计算每一个目标的3d位置及类别。2.根据权利要求1所述的基于深度学习的3d目标检测办法，其特征在于，步骤(1)中，训练样本图像中的目标对象均己进行标注，kitti数据集的标签文件包含目标对象的标注信息有：目标维度长宽高l，w，h，目标在地面中心点的坐标x，y，z，偏转角yaw，相机的内参矩阵K。3.根据权利要求2所述的基于深度学习的3d目标检测办法，其特征在于，步骤(1)中，目标中心点的高斯分布：设置一个iou阈值，假设一个目标在图像上的尺寸为(h，w)，求使得预测框和真实框的iou值大于thre_iou的圆圈的半径，记为r；根据r计算得出目标中心点的高斯分布，表达这个位置有目标的概率；设目标的中心为A，点B在水平方向距离A的距离为x，在垂直方向距离A的距离为y，则可以用表示点B是目标中心的概率，其中，θ＝r/3，x，y的范围为(
‑
r，r)。4.根据权利要求1所述的基于深度学习的3d目标检测办法，其特征在于，步骤(2)中，主干网络采用多个残差结构，残差块内部的结构为1*1卷积层，批量归一化层，激活函数层，3*3卷积层，批量归一化层，激活函数层，1*1卷积层，批量归一化层，激活函数层；输入经过前八层后得到输出，与输入相加，再经过激活函数层得到输出；残差块之间的连接关系为上一个残差块的输出为下一个残差块的输入，上一个残差块得到的特征图输入到当前残差块，经过卷积后得到新的特征图，和输入的特征图相加完成特征的融合，输入到下一个残差块，以此类推。5.根据权利要求1所述的基于深度学习的3d目标检测办法，其特征在于，步骤(2)中，包括分类分支和回归分支；分类分支，结构为3*3卷积层，批量归一化层，激活层，1*1卷积层，其输出为概率矩阵，通道数量为待识别的类别数量，矩阵内的值为该位置出现目标的概率；回归分支，结构为3*3卷积层，批量归一化层，激活层，1*1卷积层，其输出为七个，分别为距离偏移z
o
，目标中心在图像投影点的偏移x
o
，y
o
，目标的三围尺寸的偏移h
o
，w
o
，l
o
，以及偏转角yaw的偏移yaw
o
。6.根据权利要求5所述的基于深度学习的3d目标检测办法，其特征在于，步骤(3)中，损失度计算为，l＝αl
c
+βl
r
，其中，α＝1，β＝1，分类分支损失度l
c
，回归分支损失度l
r
；分类分支损失度l
c
＝l1+l2/n，其中，对特征值的真值为1的位置，损失度l1＝
‑
log
p
**(1
‑

【专利技术属性】
技术研发人员：苏畅，陈诚，张旸，
申请(专利权)人：奥特酷智能科技南京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人