一种基于三元注意力机制的鲁棒三维目标检测方法技术

技术编号:23892042 阅读:70 留言:0更新日期:2020-04-22 06:52
本发明专利技术公开了一种基于三元注意力机制的鲁棒三维目标检测方法,即以点云数据作为输入,通过该网络,输出在点云空间中目标物的三维包围盒。步骤包括:首先将点云转化成体素形式;然后使用三元注意力机制对每个体素进行特征提取;紧接着采用一个Coarse‑to‑Fine回归方式输出最终的候选框。该方法的核心思想包括如下两部分:1)采用了一种新颖的三元注意力机制来学习每个体素的特征表示,获得鲁棒的体素特征;2)使用金字塔采样融合方式实现跨层的融合,能同时获得网络低层的高分辨率精细的特征以及高层的语义信息,从而实现对目标精确的定位。本发明专利技术相较于之前的方法,尤其是在受干扰严重以及场景复杂的情况下,本发明专利技术的方法具有很好的鲁棒性。

【技术实现步骤摘要】
一种基于三元注意力机制的鲁棒三维目标检测方法
本专利技术属于计算机视觉
,更具体地,涉及一种基于三元注意力机制的鲁棒三维目标检测方法。
技术介绍
近年来,随着人工智能的迅速发展,无人驾驶技术成为了一个非常热门的话题。该技术能够有效的节省人们的驾驶时间,同时能够很好地减少交通事故的发生。无人驾驶中比较重要模块便是感知模块,即要求利用汽车传感器采集的数据,能够很好地对周围环境进行感知。在此模块中,三维目标检测是一个十分核心的环节,比如道路上的车辆、行人、以及交通标志和红绿灯等。只有让车能够像人一样,懂得如何识别这类物体,无人驾驶技术才会有可能成为现实。针对三维目标检测,按照输入数据的形式来划分,主要分为三大类。第一种,从单个视角去检测目标物,比如前视图或者鸟瞰图,但是这类方法会损失大量的三维信息,检测的效果并不好。第二种,直接从雷达采集到的点云数据中进行三维目标检测,由于点云十分稀疏,容易受到噪点的干扰,因此要提供一种具有鲁棒性的三维目标检测方案是极具挑战性的。第三种,将点云与彩色图像结合起来,一般来说,先在图像中检测到目标物,然后通本文档来自技高网...

【技术保护点】
1.一种基于三元注意力机制的鲁棒三维目标检测方法,其特征在于,包括以下步骤:/n(1)点云体素化:对于一个三维空间的点集P={p

【技术特征摘要】
1.一种基于三元注意力机制的鲁棒三维目标检测方法,其特征在于,包括以下步骤:
(1)点云体素化:对于一个三维空间的点集P={pk=[xk,yk,zk,rk]T}k=1,2,...,N,其中N表示点的个数,xk,yk,zk分别表示沿着x,y,z轴的坐标值,rk表示激光雷达的反射强度,定义点云沿着x,y,z轴的长度分布范围表示为W,H,D,每个体素沿着x,y,z尺寸定义为sW,sH,sD,在进行体素化时,对于不包含任何点云的体素,则被认为是无效的体素,它们将不参与后面网络的计算,从一个点云中得到了K个有效的体素,其中第k个体素用Vk表示;
(2)体素特征提取:利用空间注意力机制得到各个体素的空间注意力Sk,利用通道注意力机制得到各个体素的通道注意力Uk,结合空间注意力和通道注意力,得到注意力变换矩阵Mk=Sk×Uk,将其归一化并和体素V点乘处理得到联合空间和通道注意力的体素特征表示F,基于体素的注意力机制对每个体素的重要性进行权衡获得体素注意力权重矩阵Q,并利用体素注意力权重矩阵Q和体素特征表示F得到一个更加综合且鲁棒的体素特征表示F′;
(3)Coarse-to-Fine检测网络进行估计:Coarse-to-Fine检测网络由Coarse回归网络和Fine精调网络组成,以体素特征表示F′作为输入,首先经过Coarse回归网络,生成出粗略的候选框以及相应的打分,接着经过Fine精调网络,采用金字塔式采样方法获取物体不同层次的语义信息,并对Coarse回归网络生成的候选框进行精调,从而实现更加精准的定位。


2.如权利要求1所述的基于三元注意力机制的鲁棒三维目标检测方法,其特征在于,所述利用空间注意力机制得到各个体素的空间注意力Sk,具体为:
对于在体素Vk中的第i个点,首先沿着通道维采用一个最大池化操作,具体表示如下:其中C表示点云特征的数目;
采用如下公式进行计算:其中W1,W2分别表示两个1×1卷积网络的权重参数,δ表示ReLU激活函数;
对每个体素集合V,它的空间注意力表示为其中T表示每个体素中最大点的数目。


3.如权利要求1所述的基于三元注意力机制的鲁棒三维目标检测方法,其特征在于,利用通道注意力机制得到各个体素的通道注意力Uk,具体为:
对于在体素Vk中的第i个点,沿着空间点的维度采用一个最大池化操作,具体表示如下:
采用如下公式进行计算:其中W1,W2分别表示两个1×1卷积网络的权重参数,δ表示ReLU激活函数;
对每个体素集合V,它的空间注意力表示为其中T表示每个体素中最大点的数目。


4.如权利要求1至3任一项所述的基于三元注意力机制的鲁棒三维目标检测方法,其特征在于,将注意力变换矩阵M归一化并和体素V点乘处理得到联合空间和通道注意力的体素特征表示F,具体为:
用一个SigMoid激活函数将注意力变换矩阵的值的范围变到[0,1],并与体素V进行点乘,将原始的体素通过该变换阵得到一个更具有区分度的体素特征表示F,具体计算如下:
F=SigMoid(M)·V。


5.如...

【专利技术属性】
技术研发人员:白翔刘哲周瑜黄腾腾
申请(专利权)人:华中科技大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1