图像检测的方法、装置、电子设备以及存储介质制造方法及图纸

技术编号：25953183 阅读：15 留言：0更新日期：2020-10-17 03:45

本申请公开了一种图像检测的方法、装置、电子设备以及存储介质，涉及自动驾驶、计算机视觉、深度学习领域。具体实现方案为：获取在待测环境中相机采集的待测图像；将待测图像的全局特征、待测图像的局部特征和待测环境的深度图特征进行融合，获取待测图像的融合特征；根据待测图像的融合特征，预测待测图像中的障碍物距离相机的深度。相比于现有技术，本申请结合待测环境的深度图特征对图像中的障碍物距离相机的深度进行预测，提高了图像检测的精度和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
图像检测的方法、装置、电子设备以及存储介质
本申请实施例涉及计算机技术中的计算机视觉、自动驾驶和深度学习领域，尤其涉及一种图像检测的方法、装置、电子设备以及存储介质。
技术介绍
无人驾驶技术，是指通过传感器来感知车辆周围环境，并根据感知所获得的道路、车辆位置和障碍物等，控制车辆的转向和速度，从而使车辆能够安全、可靠地在道路上行驶的技术。三维车辆检测用于检测车辆周围的障碍物，对无人驾驶技术至关重要。目前，针对道路场景下的三维车辆检测主要基于车载双目相机的图像或雷达数据。针对固定监控场景下的三维车辆检测，可以直接通过网络预测三维检测框的八个顶点在图像上的投影或长宽高、朝向角信息从而实现障碍物检测；或者，还通过单目深度估计将图像结合深度信息转换为伪点云，再通过3D点云检测的方法进行障碍物检测。然而，依赖双目相机的方式对障碍物深度估计的精度要求较高，计算复杂度高，无法满足实时性和鲁棒性需求。依赖雷达的方式不满足监控摄像头下的应用场景需求，并且雷达生成的点云较为稀疏，远处检测精度较低。基于二维图像的方式往往会受到透视投影引起的近大远小的影响，从而导致估计的3D检测框不够准确，检测精度不足。因此，现有的三维车辆检测方法无法同时满足精度和鲁棒性的要求。
技术实现思路
本申请提供了一种图像检测的方法、装置、电子设备以及存储介质。根据本申请的第一方面，提供了一种图像检测的方法，包括：获取在待测环境中相机采集的待测图像；将所述待测图像的全局特征、所述待测图像的局部特征和所述待测...

【技术保护点】
1.一种图像检测的方法，包括：/n获取在待测环境中相机采集的待测图像；/n将所述待测图像的全局特征、所述待测图像的局部特征和所述待测环境的深度图特征进行融合，获取所述待测图像的融合特征；/n根据所述待测图像的融合特征，预测所述待测图像中的障碍物距离所述相机的深度。/n

【技术特征摘要】
1.一种图像检测的方法，包括：
获取在待测环境中相机采集的待测图像；
将所述待测图像的全局特征、所述待测图像的局部特征和所述待测环境的深度图特征进行融合，获取所述待测图像的融合特征；
根据所述待测图像的融合特征，预测所述待测图像中的障碍物距离所述相机的深度。

2.根据权利要求1所述的方法，在所述获取所述待测图像的融合特征之前，还包括：
从所述待测环境的地面深度图中提取所述待测环境的深度图特征。

3.根据权利要求2所述的方法，其中，所述从所述待测环境的地面深度图中提取所述待测环境的深度图特征，包括：
将所述待测环境的地面深度图输入主干网络中，并获取所述主干网络输出的所述待测环境的深度图特征。

4.根据权利要求2所述的方法，在所述从所述待测环境的地面深度图中提取所述待测环境的深度图特征之前，还包括：
根据所述待测环境的地面上的至少一个点距离所述相机的深度，建立所述待测环境的地面深度图。

5.根据权利要求4所述的方法，在所述建立所述待测环境的地面深度图之前，还包括：
根据所述待测环境的地面上的至少一个点在图像坐标系下的坐标，确定所述待测环境的地面上至少一个点距离所述相机的深度。

6.根据权利要求5所述的方法，其中，所述根据所述待测环境的地面上至少一个点在图像坐标系下的坐标，确定所述待测环境的地面上的至少一个点距离所述相机的深度，包括：
获取所述待测环境的地面上的至少一个点在图像坐标系下的坐标；
根据所述待测环境的地面上的至少一个点在图像坐标系下的坐标、所述相机的内参和地面方程，确定所述待测环境的地面上至少一个点距离所述相机的深度。

7.根据权利要求6所述的方法，其中，所述根据所述待测环境的地面上至少一个点在图像坐标系下的坐标、所述相机的内参和地面方程，确定所述待测环境的地面上的至少一个点距离所述相机的深度，包括：
根据所述相机的内参和所述地面方程，对所述待测环境的地面上的至少一个点在图像坐标系下的坐标进行反射投影，计算出待测环境的地面上的至少一个点距离所述相机的深度。

8.根据权利要求1-7任一项所述的方法，其中，所述根据所述待测图像的融合特征，预测所述待测图像中的障碍物距离所述相机的深度，包括：
将所述待测图像的融合特征输入神经网络模型，并获取所述神经网络模型输出的所述待测图像中的障碍物距离所述相机的深度。

9.根据权利要求8所述的方法，其中，所述神经网络模型为卷积神经网络模型或全连接神经网络模型。

10.根据权利要求1-7任一项所述的方法，其中，所述待测图像为单目图像。

11.一种图像检测的装置，包括：
获取模块，用于获取在待测环境中相机采集的待测图像；
融合模块，用于将所述待测图像的...

【专利技术属性】
技术研发人员：李莹莹，叶晓青，谭啸，孙昊，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人