【技术实现步骤摘要】
一种自动驾驶图像识别方法、装置及识别设备
[0001]本专利技术属于图像数据处理
,具体涉及一种自动驾驶图像识别方法、装置及识别设备。
技术介绍
[0002]目前在自动驾驶中的3D目标识别领域,实时高性能的多摄融合识别方法一直是一个具有挑战的话题。近年来随着深度学习的发展,注意力机制也被应用到自动驾驶中的3D目标识别,目前类似的方法存在两种方向:
[0003]一、(CN202210501805.9基于鸟瞰图的多视角3D目标检测方法、存储器及系统)是利用相机内外参数手动将2D图像特征图转到鸟瞰图(bird
‑
eye view,BEV)空间,然后在利用注意力机制进行BEV特征的优化,这种方法由于内外参的标定存在误差导致方法先天存在精度的问题。
[0004]二、(CN202110043727.8一种基于注意力机制和关系网络的自动驾驶图像识别方法)是利用注意力机制获取2D图像特征图潜在的特征,然后手动构造关系网络,最后使用感知机(multi
‑
layer perceptron ...
【技术保护点】
【技术特征摘要】
1.一种自动驾驶图像识别方法,其特征在于,应用于识别设备,所述设备包括依次通讯连接的提取模块(10)、多头注意力模块(20)、上采样编码器(30)和分割头(40),所述提取模块(10)内耦合有卷积网络(11)和多层感知机(12),所述方法包括以下步骤:S1,基于所述提取模块(10)对车身周视多视图的多尺度特征进行提取;S2,基于所述多头注意力模块(20)对所述多尺度特征识别后输出鸟瞰图特征;S3,基于所述上采样编码器(30)和所述分割头(40)对所述鸟瞰图特征进行上采样和语义分割。2.根据权利要求1所述的自动驾驶图像识别方法,其特征在于,所述多尺度特征包括key、value和query,其中,所述key和所述value基于所述卷积网络(11)生成,所述query基于深度卷积网络和多层感知机(12)生成。3.根据权利要求2所述的自动驾驶图像识别方法,其特征在于,所述key和所述query的位置编码分别基于所述多视图的世界坐标点、像素坐标、比例因子、相机内参、外参旋转矩阵和位移向量生成。4.根据权利要求3所述的自动驾驶图像识别方法,其特征在于,所述多层感知机(12)包括正则模块...
【专利技术属性】
技术研发人员:管恒,
申请(专利权)人:重庆长安汽车股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。