基于逐像素抑制不显著语义的快速三维目标检测方法技术

技术编号:38604322 阅读:20 留言:0更新日期:2023-08-26 23:37
本发明专利技术公开了基于逐像素抑制不显著语义的快速三维目标检测方法,步骤1,点云数据预处理;步骤2,构建基于逐像素抑制不显著语义引导的下采样模块;步骤3,构建基于线性

【技术实现步骤摘要】
基于逐像素抑制不显著语义的快速三维目标检测方法


[0001]本专利技术属于计算机视觉及人工智能
,涉及基于逐像素抑制不显著语义的快速三维目标检测方法。

技术介绍

[0002]三维目标检测是点云处理的基础任务之一,其目的是在三维场景中通过激光雷达生成的点云图像来定位和识别三维物体;在自动驾驶等现实应用中,三维目标检测起着至关重要的作用;
[0003]近年来研究人员从点云中提取高维特征主要采用基于体素或鸟瞰图和基于点两种方法。基于体素或鸟瞰图的方法将三维场景离散化,并在规则网格或鸟瞰图上进行特征学习,但体素化的操作带来量化误差会降低其定位精度。相比之下,基于点的方法通过在原始点中提取特征,可以获得准确的点的位置和丰富的特征。然而由于点云的无序性和模糊的信息损失,导致点采样方案存在昂贵的计算/内存成本和有限的检测性能,还有一些方法是将这两种策略结合起来,这种叠加组合会带来庞大的复杂计算。
[0004]我们利用抑制不显著特征的语义信息做引导,在下采样过程中剔除背景点的采样,使目标检测任务更加专注于前景信息。我们提出了一个一种基于线本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于逐像素抑制不显著语义的快速三维目标检测方法,其特征在于,具体按以下步骤实施:步骤1,点云数据预处理;步骤2,构建基于逐像素抑制不显著语义引导的下采样模块;步骤3,构建基于线性

卷积联合通道增强自注意力特征提取模块;步骤4,构建基于全局

局部耦合注意力机制的中心预测模块。2.根据权利要求书1所述的基于逐像素抑制不显著语义的快速三维目标检测方法,其特征在于,所述步骤1具体为:采用KITT作为数据集,将训练集拆分为训练样本和验证样本,在训练过程中,采用场景级增强和对象级增强两种数据增强策略;所述场景级增强包括随机场景的翻转、绕z轴旋转以及缩放,场景中存在50%的点进行随机翻转;场景围绕z轴随机旋转,随机值为如式(1)所示;随机进行场景缩放,随机因子为[0.95,1.05];v

=cos(θ)v+(1

cos(θ))(u
·
v)u+sin(θ)(u
×
v)
ꢀꢀ
(1)式中,v

为输出向量,v输入点云特征向量,u为旋转轴,θ为旋转角度;所述对象级增加为转换来自其他场景的对象。3.根据权利要求书1所述的基于逐像素抑制不显著语义的快速三维目标检测方法,其特征在于,所述步骤2具体按以下步骤实施:步骤2.1,构建基于通道增强的逐像素抑化注意力模块PBSA,在特征映射中进行自适应分配权重比,抑制不显著语义信息;步骤2.2,构建逐点语义信息预测卷积层;步骤2.3,构建抑化语义引导的下采样模块。4.根据权利要求书3所述的基于逐像素抑制不显著语义的快速三维目标检测方法,其特征在于,所述步骤2.1具体按以下步骤实施:步骤2.1.1,以点卷积和池化层基础,构建通道增强模块,具体按以下步骤实施:步骤2.1.1.1,对于标准池化层,设输入张量为大小为B
×
N
×
C的f,则U通过池化层生成B
×
N
×
1的V,采用全局最大池化GlobalMaxPooling和局部最大池化MaxPooling相结合的方法,选择区域内最具有代表性的点表示局部特征V1,V2,如式(2)所示:V1,V2=MaxPool(f),Global MaxPool(f)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(2);步骤2.1.1.2,将步骤2.1.1.1生成的特征V1,V2作为输入,将其送入同一个共享的多层感知机MLP中,MLP是由两层轻量的卷积层、和激活层组成;第一层进行特征提取,通道放缩为1/8,第二层恢复通道数;其中卷积层为一维卷积,之后,通过Sigmoid层获得归一化权值,最后通过元素积和元素加将归一化的关注权值加权到每个通道的特征中,如式(3)所示:f
out
=σ(MLP(V1)+MLP(V2))
×
f+f
ꢀꢀꢀꢀꢀꢀ
(3)式中,f
out
为输出特征,MLP为输入多层感知机,σ为Sigmoid激活函数;步骤2.1.1.3,构建抑化模块,首先使用Batch Normalization进行缩放,方差大小表示某通道的重要程度,与权重w相乘实现抑制不显著特征,如式(4)所示:F=σ(BN(f
out
)
×
W
γ
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)式中,BN为Batch Normalization归一化函数,W
γ
为归一化权重信息。
5.根据权利要求书3所述的基于逐像素抑制不显著语义的快速三维目标检测方法,其特征在于,所述步骤2.2具体按以下步骤实施:步骤2.2.1,设计一个轻量级的语义预测模块,具体的将第k个SA层的点特征进行两层简单的MLP,每个点的得分为S,如式(5)所示;式中,MLP
k
(
·
)表示第k个SA层内的点分割集,将输入逐点特征映射到前景得分S
i
,PBSA(
·
)是逐像素抑化模块,σ(
·
)是Sigmoid函数;步骤2.2.2,将语义预测信息进行数据增强处理。6.根据权利要求书3所述的基于逐像素抑制不显著语义的快速三维目标检测方法,其特征在于,所述步骤2.3具体按以下步骤实施:步骤2.3.1,将点云拆分为四个平行部分,加快FPS操作,得到最终的第一层采样点集合ι
s1
,如式(6)所示;式中,DFPS为最远点采样方式,M为采样点数;步骤2.3.2,设计一种抑化语义引导特征和距离的融合下采样方法,各自采样一半的点,相加得到最终点索引,通过提前学习的抑制背景点的语义评分,避免背景分数较低的点在采样过程中出现,使计算集中在前景区域,得到最终的采样点集合l
seg
,如式(7)所示;式中,DNSFPS是设...

【专利技术属性】
技术研发人员:宋霄罡周振华黄钰茵朱创鑫候伟茜黑新宏
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1