基于点柱的二阶多注意力机制3D点云目标检测方法技术

技术编号：37143122 阅读：24 留言：0更新日期：2023-04-06 21:52

本发明专利技术提供了基于点柱的二阶多注意力机制3D点云目标检测方法，该方法包括以下步骤：提出基于点柱的二阶点注意力机制、二阶通道注意力机制、伪图像空间注意力机制三种机制来分别实现目标检测的方法；提供一种网络，该网络主要由二阶点注意力机制、点柱特征网络、二阶通道注意力机制、主干网络、伪图像空间注意力机制和SSD检测头组成，然后将点云体素化，对点云进行二阶点注意力机制操作，转换成伪图像的特征，伪图像的特征进行二阶通道注意力机制操作，输出伪空间的特征，对伪空间的特征进行伪图像空间注意力机制操作，输出得到检测结果；通过本发明专利技术，保证了相对较高的检测速度也保证了提取的准确性。了提取的准确性。了提取的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于点柱的二阶多注意力机制3D点云目标检测方法

[0001]本专利技术属于3D纯激光雷达点云目标领域，具体涉及基于点柱的二阶点注意力机制、二阶通道注意力机制、伪图像空间注意力机制三种机制来分别实现目标检测的方法。

技术介绍

[0002]当前，3D点云目标检测方法在计算机视觉、自动驾驶、机器人和虚拟现实等领域得到越来越多的广泛应用。与二维图像的目标检测相比，激光雷达可以提供更可靠的深度信息，更准确地定位物体并提供形状信息。但由于3D点云无纹理、遮挡截断和反射不均匀，激光雷达点云稀疏且密度变化很大，基于手工特征的传统的3D目标检测方法的精度常常因此受到影响。近些年，随着深层神经网络展现出优异的特征提取能力，可以处理高维数据，基于深度神经网络的3D点云目标检测方法在精度上得到一定程度的提升。尽管如此，由于点云的高度稀疏性和本质上的不规则性等原因，一些类别的检测结果的精度还是有很大的提升空间。
[0003]如2016年Li等人提出了VeloFCN，将点云转换为前视特征图表示，然后使用现成的探测器。(参考B.Li,T.Zhang,and T.Xia,“VeloFCN:Vehicle detection from 3Dlidar using fully convolutional network,”in Robotics,2016.)。2017年Qi等人提出了PointNet，PointNet首次将原始点云数据投入到深度神经网络训练的模型。(参考C.R.Qi,H.Su,K.Mo,and L.J.Guibas,“Point...

【技术保护点】

【技术特征摘要】
1.一种基于点柱的二阶多注意力机制3D点云目标检测方法，其特征在于，包括：S1：提出基于点柱的二阶点注意力机制、二阶通道注意力机制、伪图像空间注意力机制三种机制来分别实现目标检测的方法；S2：基于S1提供一种网络，该网络主要由二阶点注意力机制、点柱特征网络、二阶通道注意力机制、主干网络、伪图像空间注意力机制和SSD检测头组成，该网络也分为二阶注意力模块、二阶点注意力模块和二阶通道注意力模块；S3：将点云体素化，然后对点云进行二阶点注意力机制操作，转换成伪图像的特征；S4：对伪图像的特征进行二阶通道注意力机制操作，输出伪空间的特征；S5：对伪空间的特征进行伪图像空间注意力机制操作，输出得到检测结果；其中，SSD检测头使用主干的特征来预测物体的三维边界盒；二阶注意力模块包含全局最大池化、协方差池化和行卷积；S3中将点特征作为二阶注意力模块的输入的情况下，将获得二阶点注意力机制权重作为输出，该过程为二阶点注意力模块；当通道特征输入到二阶注意力模块时，将获得二阶通道注意力机制权重，该过程为二阶通道注意力模块。2.根据权利要求所述1的一种基于点柱的二阶多注意力机制3D点云目标检测方法，其特征在于：在给定的第K个体素中，对于体素中所有的点其中N代表点的数量的最大值、C表示通道的数量，在经过全局最大池化后,得到每个维度上的最大值组成的向量将输入到一层全连接层，其中N
×
1代表N行1列的向量，得到向量其中t是经过W1全连接层减少之后的点的数量，W1全连接层后面使用ReLU激活函数，计算得到同一体素中两点之间的协方差矩阵其中在二阶点注意力机制则t为点的数量、在二阶通道注意力机制则t为通道的数量、t
×
t为维度，对协方差矩阵进行逐行卷积，获得向量然后将向量输入到W2全连接层并使用激活函数Sigmoid函数，获得N维注意力向量所述S3中，二阶点注意力机制表示为：s＝σ(W2RC(Cov(σ(W1(GMP(X))))))式中，Cov(
·
)为计算点的协方差矩阵、RC(
·
)为行卷积、GMP(
·
)为全局最大池化、σ为ReLU激活函数、与为两个不同的全连接层、X为给定的第K个体素中的点二阶通道注意力机制与二阶点注意力机制类似，通道特征经过二阶注意力模块后，输出产生了类似的权重，所述S4中，二阶通道注意力机制表示为：M＝σ(W2RC(Cov(σ(W1(GMP(Y))))))式中，为伪图像的特征，上标H、W为伪图像的高度和宽度。3.根据权利要求所述2的一种基于点柱的二阶多注意力机制3D...

【专利技术属性】
技术研发人员：严一尔，李鑫，
申请(专利权)人：广州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人