基于时序融合的制造技术

技术编号：39575155 阅读：5 留言：0更新日期：2023-12-03 19:27

本公开提供了一种基于时序融合的

全部详细技术资料下载

【技术实现步骤摘要】
基于时序融合的3D目标检测方法、电子设备及存储介质

[0001]本公开涉及自动驾驶和计算机视觉
，本公开尤其涉及一种基于时序融合的
3D
目标检测方法
、
装置
、
电子设备及存储介质
。

技术介绍

[0002]环视车载摄像头在自动驾驶汽车上广泛装备，其中使用图像数据提取
BEV(Bird'sEye View)
特征即鸟瞰视角特征，进行
3D
目标检测，已成为自动驾驶感知模块中障碍物检测的主流
。
[0003]由于使用单帧图像数据的
BEV
特征的检测效果有限，所以当前障碍物
3D
目标检测正转向多模态和时序融合
。
[0004]目前基于
BEV
特征的时序融合方法有以下划分方式：
[0005]一，根据融合特征的阶段不同，可分为基于图像特征和
BEV
特征融合两种
。
[0006]二，按照融合特征的稀疏性，又可分为稠密的
BEV
融合和稀疏的
BEV query
融合两种方案，两者各有优势，前者根据不同帧之间的自车坐标，将前序帧
(
也即历史帧
)BEV
特征与当前帧
BEV
特征对齐后融合；后者则基于
Transformer
预测障碍物，其首先进行运动估计，对前序帧的
query
特征扩散传播，...

【技术保护点】

【技术特征摘要】
1.
一种基于时序融合的
3D
目标检测方法，其特征在于，包括：获取当前帧二维图像数据；对所述当前帧二维图像数据进行
3D
目标检测，以获得当前帧第一阶段
3D
目标检测信息；基于前序帧
3D
目标检测信息和当前帧第一阶段
3D
目标检测信息获得当前帧中历史
3D
目标运动位移；以及基于所述历史
3D
目标运动位移判断前序帧
3D
目标检测信息和当前帧第一阶段
3D
目标检测信息的匹配程度以融合当前帧第一阶段
3D
目标检测信息和前序帧
3D
目标检测信息以获得当前帧第二阶段
3D
目标检测信息作为时序融合后的当前帧
3D
目标检测信息
。2.
根据权利要求1所述的基于时序融合的
3D
目标检测方法，其特征在于，还包括：获取当前帧本车坐标系位姿至前序帧本车坐标系位姿的第一变换矩阵；其中，所述当前帧中历史
3D
目标运动位移基于前序帧和当前帧的帧间时间差及所述第一变换矩阵获得
。3.
根据权利要求2所述的基于时序融合的
3D
目标检测方法，其特征在于，所述当前帧第一阶段
3D
目标检测信息包括：当前帧第一阶段
3D
目标检测框集合和各个当前帧第一阶段
3D
目标检测框对应的
BEV
特征；所述前序帧
3D
目标检测信息包括：前序帧
3D
目标检测框集合及其对应的
BEV
特征；其中，基于前序帧和当前帧的帧间时间差及所述第一变换矩阵获得所述当前帧中历史
3D
目标运动位移，包括：对前序帧
3D
目标检测框对应的历史
3D
目标位置进行基于帧间时间差的运动位移预测，以获得当前帧时刻的历史
3D
目标预测位置；以及基于所述第一变换矩阵将所述历史
3D
目标预测位置转换至当前帧，以获得当前帧中历史
3D
目标预测位置即获得当前帧中历史
3D
目标运动位移
。4.
根据权利要求3所述的基于时序融合的
3D
目标检测方法，其特征在于，基于所述历史
3D
目标运动位移判断前序帧
3D
目标检测信息和当前帧
3D
目标检测信息的匹配程度，以融合当前帧第一阶段
3D
目标检测信息和前序帧
3D
目标检测信息以获得当前帧第二阶段
3D
目标检测信息作为时序融合后的当前帧
3D
目标检测信息，包括：基于当前帧第一阶段
3D
目标检测框的预测类别和所述当前帧中历史
3D
目标预测位置获取所述当前帧中历史
3D
目标预测位置的空间邻域内与所述当前帧第一阶段
3D
目标检测框匹配的前序帧
3D
目标检测框匹配集合及其对应的
BEV
特征匹配集合；以及将所述
BEV
特征匹配集合中的最匹配
BEV
特征与所述当前帧第一阶段
3D
目标检测框对应的
BEV
特征进行特征融合获得
BEV
融合特征，基于所述
BEV
融合特征获得当前帧第二阶段
3D
目标检测框集合及其对应的
BEV
特征，作为当前帧
3D
目标检测信息
。5.
根据权利要求4所述的基于时序融合的
3D
目标检测方法，其特征在于，将所述
BEV
特征匹配集合中的最匹配
BEV
特征与所述当前帧第一阶段
3D
目标检测框对应的
BEV
特征进行特征融合获得
BEV
融合特征，包括：基于神经网络模型将所述
BEV
特征匹配集合中的最匹配
BEV
特征与所述当前帧第一阶段
3D
目标检测框对应的
BEV
特征进行融合
。6.
根据权利要求1至5中任一项所述的基于时序融合的
3D
目标检测方法，其特征在于，
还包括：基于所述当前帧
3D
目标检测信息及所述前序帧
3D
目标检测信息中的
3D
目标检测框的置信度对所述前序帧
3D
目标检测信息进行更新以获得更新的前序帧
3D
目标检测信息以用于下一帧...

【专利技术属性】
技术研发人员：肖华辉，陈佳，李雪，
申请(专利权)人：北京易航远智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人