目标检测方法、电子设备及存储介质技术

技术编号：36453501 阅读：15 留言：0更新日期：2023-01-25 22:50

本申请实施例公开一种目标检测方法、电子设备及存储介质，该方法包括：提取图像组中图像的语义特征，得到二维语义特征图，其中，所述图像组中包括多个摄像头采集到的二维图像；对所述二维语义特征图进行深度信息估计，得到二维深度特征图；在特征图的高度维度上，对所述二维语义特征图进行特征压缩，得到一维语义特征图，以及对所述二维深度特征图进行特征压缩，得到一维深度特征图；基于所述一维语义特征图和所述一维深度特征图，生成二维鸟瞰视角特征图；基于所述二维鸟瞰视角特征图，进行目标检测。标检测。标检测。

全部详细技术资料下载

【技术实现步骤摘要】
目标检测方法、电子设备及存储介质

[0001]本申请涉及机器视觉
，特别涉及一种目标检测方法、电子设备及存储介质。

技术介绍

[0002]随着机器视觉技术的不断发展，3D目标检测技术被广泛应用于自动驾驶和机器人领域。以自动驾驶领域为例，自动驾驶车辆不仅需要识别障碍物的类型，还需要识别障碍物的精确位置和朝向，以提供信息给规划控制模块，规划出合理的线路，3D目标检测旨在通过多传感器数据如摄像头、雷达、激光雷达等，使得自动驾驶车辆具备检测车辆、行人、障碍物等物体的能力，保障行驶安全。
[0003]目前，多摄像头环视鸟瞰视角下的3D目标检测技术，由于具有高性能、支持多种任务融合如目标检测、目标分割、车道线检测等优点，近期得到了高速发展。这类3D目标检测技术相比于传统的以FCOS3D为代表的检测器，其主要改进在于将图像特征从相机视角转换到鸟瞰视角，多目特征的融合也在这一步骤中同时进行。
[0004]相关技术中，在将图像特征从相机视角转换到鸟瞰视角时，采用以BEVFormer为代表的数据驱动的转换方案，通过训练神经网络模型如Transformer模型，来实现隐式的特征转换。然而，这类方法由于使用庞大的神经网络模型，需要大量的训练数据并且占用大量的显存空间，因此在车载芯片上部署成本较高。

技术实现思路

[0005]本申请实施例提供一种目标检测方法、电子设备及存储介质，以解决3D目标检测技术在车载芯片上部署成本较高的技术问题。
[0006]根据本申请的第一方面，公开了一种目标检测方法，所...

【技术保护点】

【技术特征摘要】
1.一种目标检测方法，其特征在于，所述方法包括：提取图像组中图像的语义特征，得到二维语义特征图，其中，所述图像组中包括多个摄像头采集到的二维图像；对所述二维语义特征图进行深度信息估计，得到二维深度特征图；在特征图的高度维度上，对所述二维语义特征图进行特征压缩，得到一维语义特征图，以及对所述二维深度特征图进行特征压缩，得到一维深度特征图；基于所述一维语义特征图和所述一维深度特征图，生成二维鸟瞰视角特征图；基于所述二维鸟瞰视角特征图，进行目标检测。2.根据权利要求1所述的方法，其特征在于，所述基于所述一维语义特征图和所述一维深度特征图，生成二维鸟瞰视角特征图，包括：基于静态变换矩阵，以所述一维深度特征图中的深度信息为引导，将所述一维语义特征图中的特征投影到二维鸟瞰视角特征图中；其中，所述静态变换矩阵是基于所述多个摄像头的内参信息和外参信息生成的，所述静态变换矩阵中包含极坐标系与笛卡尔坐标系之间的坐标转换信息，所述坐标转换信息用于将极坐标系下的语义特征和深度信息转换为笛卡尔坐标系下的二维鸟瞰视角特征。3.根据权利要求2所述的方法，其特征在于，所述静态变换矩阵包括：环矩阵和射线矩阵，其中，所述环矩阵中包含所述多个摄像头的深度信息，所述射线矩阵包含所述多个摄像头的方向信息。4.根据权利要求3所述的方法，其特征在于，所述基于静态变换矩阵，以所述一维深度特征图中的深度信息为引导，将所述一维语义特征图中的特征投影到二维鸟瞰视角特征图中，包括：对所述环矩阵与所述一维深度特征图中的深度信息进行矩阵叉乘运算，得到中间矩阵；将所述中间矩阵与所述射线矩阵进行矩阵点乘运算，得到投影矩阵；将所述投影矩阵与所述一维语义特征图中的特征进行矩阵叉乘运算，得到二维鸟瞰视角特征图。5.根据权利要求3所述的方法，其特征在于，所述环矩阵的生成过程包括：构建尺寸为L*L的第一初始矩阵，以及设置M个深度值d，其中，L为二维鸟瞰视角特征图的尺寸，M为所述一维语义特征图中深度信息的通道数，L和M均为大于1的整数；对于每个深度值d，在所述第一初始矩阵的每个位置，若该位置对应的实际坐标到摄像头的深度等于d，则将该位置的值设置为1，否则设置为0，得到M个尺寸为L*L的矩阵；对所述M个尺寸为L*L的矩阵进行叠加，得到所述环矩...

【专利技术属性】
技术研发人员：周鸿宇，葛政，
申请(专利权)人：北京迈格威科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人