【技术实现步骤摘要】
基于多模态融合的物体检测方法、系统、设备及介质
[0001]本公开涉及自动驾驶感知
,尤其涉及一种基于多模态融合的物体检测方法
、
系统
、
设备及介质
。
技术介绍
[0002]3D(
三维
)
目标检测是自动驾驶领域中的一项基本感知任务,它旨在对
3D
空间中的目标进行分类和定位
。
作为两种常用的传感器,激光雷达和相机能够以不同的方式感知自车周围的环境
。
激光雷达生成的点云数据能够通过发射波长来刻画自车周围的场景,并提供可信的
3D
目标的空间位置和几何信息
。
而相机获取的图像能够提供更稠密的语义和纹理信息
。
[0003]目前,在生成图像
BEV(
鸟瞰图
)
特征时,由于缺乏有效的深度监督,使得图像的深度预测不准确,从而造成图像
BEV
特征表达能力有限,影响最终目标检测的精度
。
[0004]另外,在进行多帧数据的时序融合时,由于需要处理每帧图像和点云原始数据,造成大量的计算资源和计算耗时,使得该方法难以在低时延,低功耗的车辆上实现物体检测
。
技术实现思路
[0005]本公开要解决的技术问题是为了克服现有技术中对物体检测的准确度不高及计算资源需求大的缺陷,提供一种基于多模态融合的物体检测方法
、
系统
、
设备及介质< ...
【技术保护点】
【技术特征摘要】
1.
一种基于多模态融合的物体检测方法,其特征在于,所述物体检测方法包括:获取目标点云数据对应的点云鸟瞰图特征;获取目标图像数据对应的多视角图像的二维图像特征;将所述点云鸟瞰图特征和所述多视角图像的二维图像特征进行处理,以生成图像鸟瞰图特征;将所述点云鸟瞰图特征与所述图像鸟瞰图特征进行融合,以生成当前帧对应的融合鸟瞰图特征;将当前帧对应的融合鸟瞰图特征和上一帧的时序融合特征进行融合,得到当前帧对应的时序融合鸟瞰图特征;基于所述当前帧对应的时序融合特征,获取物体对应的类别和位置信息
。2.
如权利要求1所述的基于多模态融合的物体检测方法,其特征在于,所述获取目标点云数据对应的点云鸟瞰图特征的步骤包括:获取目标点云数据并对所述目标点云数据进行体素化;对每个体素的所有目标点云数据进行编码,并对每个体素内的编码特征进行最大池化处理,得到每个体素对应的体素特征;对所述体素特征进行编码,以得到目标点云数据对应的点云鸟瞰图特征
。3.
如权利要求1所述的基于多模态融合的物体检测方法,其特征在于,所述获取目标图像数据对应的多视角图像的二维图像特征的步骤包括:获取目标图像数据并对所述目标图像数据进行编码,以得到多视角图像的基础特征;对所述多视角图像的基础特征进行编码,得到多视角图像的二维图像特征;所多视角图像的二维图像特征为多层金字塔图像特征
。4.
如权利要求1所述的基于多模态融合的物体检测方法,其特征在于,所述将所述点云鸟瞰图特征和所述多视角图像的二维图像特征进行处理,以生成图像鸟瞰图特征的步骤包括:将网格对应的空间坐标映射到对应的所述二维图像特征中,以获取每个网格对应的图像特征;基于每个网格对应的图像特征,生成图像初始化鸟瞰图特征;将所述图像初始化鸟瞰图特征与所述点云鸟瞰图特征进行聚合,以生成对应的查询特征;基于所述查询特征,生成图像鸟瞰图特征
。5.
如权利要求1所述的基于多模态融合的物体检测方法,其特征在于,所述将当前帧对应的融合鸟瞰图特征和上一帧的时序融合特征进行融合,得到当前帧对应的时序融合...
【专利技术属性】
技术研发人员:胡晓林,张刚,潘湖杰,于乾坤,
申请(专利权)人:赛可智能科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。