一种跨模态交叉注意力机制的交通目标检测方法及系统技术方案

技术编号：39663093 阅读：9 留言：0更新日期：2023-12-11 18:25

本发明专利技术公开了一种跨模态交叉注意力机制的交通目标检测方法及系统，至少包括多模态特征深度融合的

全部详细技术资料下载

【技术实现步骤摘要】
一种跨模态交叉注意力机制的交通目标检测方法及系统

[0001]本专利技术属于计算机视觉及自动驾驶智能感知的
，涉及一种雷视融合多交通目标检测方法，主要涉及了一种跨模态交叉注意力机制的交通目标检测方法及系统
。

技术介绍

[0002]在城市交通场景中，对自动驾驶汽车周围环境进行探测的多交通目标感知是汽车自动驾驶中的重要前提，通过识别交通信号标志
、
其他汽车
、
自行车和行人等目标，以及感知周围物体的距离和速度，从而及时做出判断和反应，能够为后续的智能导航
、
路径规划等功能模块提供数据支撑
。
激光雷达和相机作为自动驾驶目标感知领域中两种最常用的传感器，分别提供精确的
3D
空间信息和丰富的颜色纹理特征
。
由于传感器自身的限制，激光雷达点云数据本身缺乏具体的语义特征且较为稀疏，远距离或拥堵情况下几乎失效，而相机传感器获取的
RGB
图像不具备三维空间的深度信息，被动接收反射光导致成像功能对于光照极为敏感，也造成了感知精度的敏感性
。
[0003]依靠单模态方法在遮挡
、
多尺度变化条件下效率低下且不可靠，为获取更大范围
、
更精确的环境信息，将两者优势充分结合为城市高密度环境下多交通目标的高精度感知提供了可能
。
但是，由于
RGB
图像和点云属于异源异构数据，融合方式的差异直接影响到检测器的性能，如何将这两种数...

【技术保护点】

【技术特征摘要】
1.
一种跨模态交叉注意力机制的交通目标检测方法，其特征在于：至少包括多模态特征深度融合的
3D
目标检测网络模型，所述模型中包括跨模态数据增强模块
、
点云分支主干网络模块
、
图像分支主干网络模块
、
点云
‑
图像交叉注意力融合模块和检测任务处理模块，其中，所述跨模态数据增强模块：依次经过点云数据增强
、
图像数据增强和图像
‑
点云数据关联后，得到增强后的像素坐标点；所述点云分支主干网络模块：依次经过分组
、
采样和稀疏卷积特征提取步骤后，通过体素划分法将点云划分到独立的体素中，进行点云特征提取；所述图像分支主干网络模块：包括编码器和解码器，采用
ResNet
与特征金字塔网络结合的方式提取图像特征；所述点云
‑
图像交叉注意力融合模块：用于对齐提取后的点云特征和图像特征进行融合；所述检测任务处理模块：基于中心点的检测头用于目标回归，分别求解中心点位置和目标框几何参数，完成目标检测任务
。2.
使用如权利要求1所述系统的一种跨模态交叉注意力机制的交通目标检测方法，其特征在于，包括如下步骤：
S1,
数据集构建：所述数据集包括点云数据和图像数据，多交通目标感知数据集，采集车载相机与激光雷达的同步数据进行标注和标定，形成点云
‑
图像多交通目标感知数据集；
S2
，跨模态数据增强：包括点云数据增强
、
图像数据增强和图像
‑
点云数据关联，所述点云数据增强方法具体为：对点云及其
3D
包围框内点进行随机旋转
、
尺度变换和二次随机旋转后，记录该帧点云的
ID
和随机处理参数；所述图像数据增强方法具体为：使用随机旋转
、
随机翻转和多尺度变换的方法，对图像进行数据增强操作；所述图像
‑
点云数据关联具体为：基于经过点云数据增强保存的数据增强参数，根据变换参数反转所有增强数据，获得
3D
关键点的原始坐标，根据外部投影参数在相机空间中找到其对应的原始像素坐标，将对应像素坐标点按照图像数据增强的方法进行处理，得到增强后的像素坐标点；
S3
，点云特征提取：包含分组
、
采样和稀疏卷积特征提取三个步骤，通过体素划分法将点云划分到独立的体素中，进行点云特征提取；
S4
，图像特征提取：采用
ResNet
与特征金字塔网络结合的方式来提取图像特征；
S5
，点云
‑
图像交叉注意力融合：基于图特征的重映射和交叉注意力机制，将对齐提取后的点云特征和图像特征进行融合；
S6
，检测任务处理：基于中心点的检测头用于目标回归，分别求解中心点位置和目标框几何参数；
S7,
损失函数计算：所述损失函数包括热力图损失
、
中心点位置偏移损失
、
地面高度损失
、
目标尺寸损失和偏航角正余弦损失，将所有损失合并，可以得到组合
Loss
；
S8
，训练模型并输出：采用
PyTorch
深度学习框架训练目标检测网络模型，完成目标检测
。3.
如权利要求2所述的一种跨模态交叉注意力机制的交通目标检测方法，其特征在于：
所述步骤
S2
中的点云数据增强具体包括：
S21
：设每帧获取的点云数据
P
i
(x
i
,y
i
,z
i
)∈R3，共
N
个点，其中第
k
个目标的真实
3D
包围框
B
i
参数化为其中是中心位置，是长度
、
宽度
、
高度，是围绕
z
轴的偏航旋转；
S22
：对真实
3D
包围框及框内点随机旋转，旋转因子为均匀分布的随机变量
△
θ
∈[
‑
π
/10,
π
/10]
；
S23
：对全局点云应用尺度变换，将帧内所有点
P
i
(x
i
,y
i
,z
i
)
与均匀分布尺度变换因子
λ
∈[0.95,1.05]
相乘，对所有点云进行全局缩小和放大；
S24
：对全局点云应用随机旋转，将全局旋转应用于所有
3D
包围框
B
i
和整个点云，全局旋转偏移量为均匀分布的随机变量
△
γ
∈[
‑
π
/4,
π
/4]
；
S25
：记录该帧点云的
ID
和随机处理参数，对点云
x.pcd
顺时针旋转
angel
°
，记为
{x
，
angel
°
}。4.
如权利要求2所述的一种跨模态交叉注意力机制的交通目标检测方法，其特征在于：所述步骤
S3
具体包括：
S31
：进行点云分组，给定点云
P
＝
{p1,p2,
...

【专利技术属性】
技术研发人员：李旭，王贲武，兰浩然，徐启敏，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人