【技术实现步骤摘要】
一种融合双重注意力机制的单目3D目标检测方法
[0001]本专利技术属于计算机视觉领域,具体涉及一种融合双重注意力机制的单目3D目标检测方法。
技术介绍
[0002]现阶段,基于深度学习技术的计算机视觉领域是无人驾驶人工智能的一大热门。伴随着无人驾驶技术水平的不断拔高,无人驾驶汽车行业市场规模也迎来了史无前例的快速增长。无人驾驶感知系统构建在激光雷达、毫米波雷达等传感器的共同作用基础上,同时也需要机器视觉感知系统才能构建出一个可以识别交通标志、车道线、周围行人车辆的强大体系。因此,机器视觉是自动驾驶领域不可或缺的一部分,而3D目标检测也正是机器视觉中最为基础也最为关键的一个部分,在自动驾驶中扮演了非常重要的角色,在障碍物检测与定位中也至关重要。
[0003]当前的3D目标检测算法中,基于激光雷达、RGB
‑
D相机的技术成本高昂,作用距离短并且线数再多的激光雷达获取的点云也是稀疏且缺乏纹理信息的,同时双目相机误差较大,不仅要求时间同步、体积较大而且对基线安装有较高要求。相比之下,单目相机价格亲民体积小 ...
【技术保护点】
【技术特征摘要】
1.一种融合双重注意力机制的单目3D目标检测方法,其特征在于:所述方法包括如下步骤:步骤1:读入RGB图片,在主干网络中进行特征的提取;所述主干网路基于包含残差连接的DLA34网络;步骤2:构建全局注意力机制网络,进行特征融合与加强,得到特征图;步骤3:将处理后的特征图输入至各个预测分支处理,得到新局部特征图;步骤4:使用一个卷积注意力机制CBAM模块对预测分支进行处理,以上一步得到的特征图作为模块的输入;步骤5:将各个结果整合并输入至一个卷积核大小为1x1的卷积网络,输出参数结果;步骤6:根据模型输出的参数画出目标对应的3D框图。2.根据权利要求1所述的一种融合双重注意力机制的单目3D目标检测方法,其特征在于:步骤1中,使用摄像头从场景中读取RGB图像,将其输入至已完成构建的模型中。3.根据权利要求1所述的一种融合双重注意力机制的单目3D目标检测方法,其特征在于:步骤2中,使用空间注意力模块在通道维度上进行最大值和平均值的汇聚,将多通道压缩成单通道,然后通过带有注意力权重的卷积提取注意力信息并通过激活函数使得空间注意力权重非负,最终将空间注意力的权重值与原图相乘得到特征图。4.根据权利要求1所述的一种融合双重注意力机制的单目3D目标检测方法,其特征在于:步骤3中,依次进行卷积核大小为3x3的卷积,然后经过一个激活函数层,得到新局部特征图...
【专利技术属性】
技术研发人员:马泽森,付慧,王纯洁,徐鹤,季一木,刘尚东,苏俞彪,徐鑫,张澳生,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。