纯视觉自动驾驶场景空间占据识别方法、系统及存储介质技术方案

技术编号：37961745 阅读：8 留言：0更新日期：2023-06-30 09:36

本发明专利技术公开了一种纯视觉自动驾驶场景中的三维空间占据识别方法、系统及存储介质，空间占据识别方法包括：获取自动驾驶场景各个环视视图图片的二维特征和深度概率；基于各个环视视图图片的内外参使用3D到2D的投影得到三维空间每个位置的特征值；根据得到的三维空间每个位置的特征值进行分类，得到每个位置的占据预测。本发明专利技术方法能够很好的解决现有的从二维投影三维的方法中得到的三维特征过于稀疏的问题，此外，本方法直接预测三维空间中每个位置的占据情况，而不是给出每个物体的包围盒，因此更加鲁棒并且利于下游控制，能够识别出数据集中不存在的类别，相比较于三维包围盒，直接预测三维空间中的占据情况能够得到更准确的三维空间中物体的形状信息。准确的三维空间中物体的形状信息。准确的三维空间中物体的形状信息。

全部详细技术资料下载

【技术实现步骤摘要】
纯视觉自动驾驶场景空间占据识别方法、系统及存储介质

[0001]本专利技术属于计算机视觉与自动化领域，具体涉及一种纯视觉自动驾驶场景中的空间占据识别方法、系统及存储介质。

技术介绍

[0002]随着自动驾驶的发展，自动驾驶的感知系统越来越重要，传统的感知系统主要依赖于车载雷达和相机对车辆周围的环境进行检测，以三维包围盒的方式给出检测结果，但是由于在实际场景中存在数据集无法覆盖的情况例如异性车辆以及数据集未标注的类别，这时传统的检测方法就会无法给出结果。因此需要一种更加鲁棒的算法对周围环境进行感知。

技术实现思路

[0003]针对上述问题，本专利技术提出一种纯视觉自动驾驶场景中的三维空间占据识别方法、系统及存储介质，能够在复杂场景下实现点云的快速识别。
[0004]一种纯视觉自动驾驶场景中的三维空间占据识别方法，包括：
[0005]步骤1，获取自动驾驶场景的环视视图图片；
[0006]步骤2，获取各个环视视图的二维特征和深度概率；
[0007]步骤3，基于图片的内外参使用3D到2D的投影得到三维空间每个位置的特征值；
[0008]步骤4，使用交叉熵损失监督深度预测的结果，使用FocalLoss监督三维语义分类器的结果。
[0009]优选的，步骤2包括：
[0010]步骤2
‑
1，使用ResNet算法对环视视图图片提取特征，ResNet由四组ResBlock组成，每组ResBlock会对输入的图片进行卷积和下采样的操作，对于六张环视...

【技术保护点】

【技术特征摘要】
1.一种纯视觉自动驾驶场景中的三维空间占据识别方法，其特征在于，包括：获取自动驾驶场景各个环视视图图片的二维特征和深度概率；基于各个环视视图图片的内外参使用3D到2D的投影得到三维空间每个位置的特征值；根据得到的三维空间每个位置的特征值进行分类，得到每个位置的占据预测。2.根据权利要求1所述的一种纯视觉自动驾驶场景中的三维空间占据识别方法，其特征在于：获取自动驾驶场景各个环视视图图片的二维特征和深度概率，包括：使用ResNet算法对各个环视视图图片提取特征，得到各个环视视图的特征图F；对提取到的各个环视视图的特征图使用DepthNet模型进行深度概率预测，得到在深度中不同地方的概率D，其中每个位置预设置一组分布。3.根据权利要求2所述的一种纯视觉自动驾驶场景中的三维空间占据识别方法，其特征在于：ResNet由四组ResBlock组成，每组ResBlock对输入的环视视图图片进行卷积和下采样的操作。4.根据权利要求2所述的一种纯视觉自动驾驶场景中的三维空间占据识别方法，其特征在于：DepthNet模型由两组卷积神经网络组成，DepthNet模型预测在这组深度中不同地方的概率D。5.根据权利要求1
‑
4任一所述的一种纯视觉自动驾驶场景中的三维空间占据识别方法，其特征在于，基于各个环视视图图片的内外参使用3D到2D的投影得到三维空间每个位置的特征值，包括：等间距划分成相同大小的网格，把每个网格的中心点投影至各个二维视图：等间距划分成相同大小的网格，把每个网格的中心点投影至各个二维视图：等间距划分成相同大小的网格，把每个网格的中心点投影至各个二维视图：其中，X
w
,Y

【专利技术属性】
技术研发人员：路通，方明胜，李志琦，
申请(专利权)人：南京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人