一种目标检测的方法、装置、电子设备及存储介质制造方法及图纸

技术编号：32510335 阅读：38 留言：0更新日期：2022-03-02 10:53

本公开提供了一种目标检测的方法、装置、电子设备及存储介质，其中，该方法包括：对待检测图像进行特征提取，得到待检测图像的特征图；基于特征图，生成待检测图像中的目标对象投影至地面的投影区域对应的深度图；基于深度图以及特征图，确定目标对象的三维检测信息。本公开中的投影区域一定程度上与目标对象产生了联系，这样，在局部地面对应的深度图能够针对性的指导在该局部地面上的目标对象的特征图进行三维检测，提升检测的精度。提升检测的精度。提升检测的精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种目标检测的方法、装置、电子设备及存储介质

[0001]本公开涉及图像处理
，具体而言，涉及一种目标检测的方法、装置、电子设备及存储介质。

技术介绍

[0002]相较于二维(2D，2
‑
Dimension)目标检测任务，三维(3D，3
‑
Dimension)目标检测任务难度更大，复杂度更高，往往需要从3D场景中检测出目标的3D几何信息和语义信息，主要包括目标的长宽高、中心点和朝向角信息。其中，由于单目图像的3D目标检测具有经济适用的优良特性，被广泛应用于各种领域(如无人驾驶领域)。
[0003]然而，基于单目图像的3D目标检测技术主要依赖于一些外部的子任务，这些子任务负责执行2D目标检测、深度图估计等任务。由于子任务单独训练，本身存在精度损失，限制了网络模型的性能上限，无法满足3D检测的精度需求。

技术实现思路

[0004]本公开实施例至少提供一种目标检测的方法、装置、电子设备及存储介质，以提升3D目标检测的精度。
[0005]第一方面，本公开实施例提供了一种目标检测的方法，所述方法包括：
[0006]对待检测图像进行特征提取，得到所述待检测图像的特征图；
[0007]基于所述特征图，生成所述待检测图像中的目标对象投影至地面的投影区域对应的深度图；
[0008]基于所述深度图以及所述特征图，确定所述目标对象的三维检测信息。
[0009]采用上述目标检测的方法，不仅可以对待检测图像进行特征提取，还可以基于提取得到...

【技术保护点】

【技术特征摘要】
1.一种目标检测的方法，其特征在于，所述方法包括：对待检测图像进行特征提取，得到所述待检测图像的特征图；基于所述特征图，生成所述待检测图像中的目标对象投影至地面的投影区域对应的深度图；基于所述深度图以及所述特征图，确定所述目标对象的三维检测信息。2.根据权利要求1所述的方法，其特征在于，在得到所述待检测图像的特征图之后，所述方法还包括：对所述特征图进行检测，得到针对所述目标对象的二维检测信息；所述基于所述深度图以及所述特征图，确定所述目标对象的三维检测信息，包括：基于所述二维检测信息，确定针对所述目标对象的三维先验框信息；基于所述三维先验框信息、所述深度图以及所述特征图，确定所述目标对象的三维检测框信息。3.根据权利要求2所述的方法，其特征在于，所述二维检测信息包括所述目标对象所在二维检测框信息和所述目标对象所属类别信息；所述基于所述二维检测信息，确定针对所述目标对象的三维先验框信息，包括：基于所述目标对象所属类别信息，确定所述目标对象所属类别包括的各个子类别的聚类信息；根据所述各个子类别的聚类信息以及所述目标对象所在二维检测框信息，确定针对所述目标对象的三维先验框信息。4.根据权利要求3所述的方法，其特征在于，所述根据所述各个子类别的聚类信息以及所述目标对象所在二维检测框信息，确定针对所述目标对象的三维先验框信息，包括：针对所述各个子类别中的每个子类别，基于该子类别的聚类信息包括的聚类高度值、所述目标对象所在二维检测框信息包括的宽度值，确定与该子类别对应的深度值；基于该子类别的聚类信息以及与该子类别对应的深度值，确定针对所述目标对象的一个三维先验框信息。5.根据权利要求3或4所述的方法，其特征在于，所述基于所述三维先验框信息、所述深度图以及所述特征图，确定所述目标对象的三维检测框信息，包括：根据所述深度图以及所述特征图确定三维检测框偏移量；基于所述三维先验框信息以及所述三维检测框偏移量，确定所述目标对象的三维检测框信息。6.根据权利要求5所述的方法，其特征在于，所述根据所述深度图以及所述特征图确定三维检测框偏移量，包括：基于所述目标对象所在二维检测框信息包括的位置范围，分别从所述深度图以及所述特征图中提取与所述位置范围匹配的深度图和特征图；基于与所述位置范围匹配的深度图和特征图确定所述三维检测框偏移量。7.根据权利要求5或6所述的方法，其特征在于，所述三维先验框信息为多个；所述基于所述三维先验框信息以及所述三维检测框偏移量，确定所述目标对象的三维检测框信息，包括：确定与每个所述三维先验框信息对应的权重；
基于各个所述三维先验框信息、每个所述三维先验框信息对应的权重、以及所述三维检测框偏移量，确定所述目标对象的三维检测框信息。8.根据权利要求7所述的方法，其特征在于，所述方法还包括：根据所述深度图以及所述特征图确定所述目标对象所在类别信息包括的各个子类别的预测概率；...

【专利技术属性】
技术研发人员：刘配，杨国润，王哲，石建萍，
申请(专利权)人：深圳市商汤科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人