图像中的三维目标识别方法技术

技术编号:39428823 阅读:21 留言:0更新日期:2023-11-19 16:14
本申请公开了一种图像中的三维目标识别方法

【技术实现步骤摘要】
图像中的三维目标识别方法、装置、存储介质及设备


[0001]本申请涉及无人驾驶
,特别涉及一种图像中的三维目标识别方法

装置

存储介质及设备


技术介绍

[0002]图像传感器是自动驾驶中常用的传感器,基于图像的目标识别一直受到广泛的关注

目标识别的重点任务是给出目标的类型,位置和大小

目前基于图像的目标识别主要分为两种,一种是二维目标识别,即识别出目标在图像二维平面上的位置;一种是三维目标识别,即识别出目标在三维空间中的位置

[0003]在单独进行二维目标识别时,可以基于
CNN(Convolutional Neural Network
,卷积神经网络
)

YOLO
系列,基于
Transformer

VIT
系列等

在单独进行三维目标识别时,可以基于单目视觉的
smoke
,基于/>BEV
本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种图像中的三维目标识别方法,其特征在于,所述方法包括:获取多张环视图,所述多张环视图由车辆中具有不同水平拍摄视角的多个摄像头同时对同一场景进行拍摄得到的图像组成;分别对每张环视图进行特征提取,得到多张特征图;对所述多张环视图进行二维目标识别,得到检测框的类型

位置和尺寸;对所述检测框的类型

位置和尺寸分别进行三维特征处理,对处理结果进行拼接得到
k
个三维查询特征,所述三维特征处理包括深度估计处理

位置嵌入处理

多层感知处理和类型嵌入处理中的至少一种,
k
为正整数;对所述
k
个三维查询特征和多张特征图进行处理,得到三维目标的识别结果
。2.
根据权利要求1所述的图像中的三维目标识别方法,其特征在于,所述对所述检测框的类型

位置和尺寸分别进行三维特征处理,对处理结果进行拼接得到
k
个三维查询特征,包括:根据所述检测框的位置进行深度估计处理,得到
k
个三维目标位置,对所述
k
个三维目标位置进行位置嵌入处理,得到
k
个第一处理结果;对所述检测框的位置进行位置嵌入处理,得到第二处理结果;对所述检测框的尺寸进行多层感知处理,得到第三处理结果;对所述检测框的类型进行类型嵌入处理,得到第四处理结果;将所述第二处理结果

所述第三处理结果和所述第四处理结果分别与每个第一处理结果进行拼接,得到
k
个三维查询特征
。3.
根据权利要求2所述的图像中的三维目标识别方法,其特征在于,所述根据所述检测框的位置进行深度估计处理,得到
k
个三维目标位置,包括:对所述检测框的位置进行深度估计处理,得到多个深度值;从所述多个深度值中选择
k
个深度值;根据所述多个摄像头的内外参矩阵分别对所述
k
个深度值进行计算,得到
k
个三维目标位置
。4.
根据权利要求3所述的图像中的三维目标识别方法,其特征在于,所述从所述多个深度值中选择
k
个深度值,包括:获取每个深度值对应的概率值;将
k

【专利技术属性】
技术研发人员:陈忠涛陈涛
申请(专利权)人:九识苏州智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1