一种目标检测方法和电子设备技术

技术编号:39833227 阅读:6 留言:0更新日期:2023-12-29 16:16
本发明专利技术公开了一种目标检测方法和电子设备,所述目标检测方法包括:根据输入数据,得第一特征集合;根据所述第一特征集合,得到所述第一特征集合在

【技术实现步骤摘要】
一种目标检测方法和电子设备


[0001]本专利技术涉及计算机
,特别是一种目标检测方法和电子设备


技术介绍

[0002]基于视觉的鸟瞰视角
(Bird

s Eye View,BEV)
表征作为目前自动驾驶领域流行的感知范式,将多个车载相机拍摄到的传感器数据从图像空间映射到统一的
BEV
空间

相比于传感器各自独立的透视视角
(Perspective View,PV)
空间,这个统一的
BEV
空间更易于跨摄像头,多模态以及时序的融合;不同于后融合和前融合技术,在
BEV
空间下,模型训练可以做到端到端的优化

然而
,
基于
BEV
的目标检测通常需要添加额外信息来辅助求解且对相机内参敏感


技术实现思路

[0003]有鉴于此,本专利技术实施例提供了一种目标检测方法和电子设备,使得基于
BEV
的目标检测无需添加额外信息来辅助求解且对相机内参不敏感

[0004]第一方面,本专利技术实施例提供了一种目标检测方法,所述方法包括:
[0005]根据输入数据,得第一特征集合;
[0006]根据所述第一特征集合,得到所述第一特征集合在
BEV
空间内的第二特征集合;
[0007]根据所述第二特征集合得到目标特征数据;
[0008]根据所述目标特征数据,得到目标检测结果,在进行基于
BEV
的目标检测过程中,无需添加额外信息来辅助求解,且训练推理独立于相机内参,对相机内参不敏感,可迁移模型到不同车型

[0009]结合第一方面,在第一方面的某些实现方式中,所述根据输入数据,得第一特征集合之前,还包括:接收所述输入数据

[0010]结合第一方面,在第一方面的某些实现方式中,所述输入数据包括可移动设备的多路相机采集的多个图片

[0011]结合第一方面,在第一方面的某些实现方式中,所述第一特征集合包括所述输入数据中每个图片的第一特征数据

[0012]结合第一方面,在第一方面的某些实现方式中,所述根据输入数据,得第一特征集合,包括:
[0013]通过骨干网络提取所述输入数据的所述第一特征数据,得到所述第一特征集合

[0014]结合第一方面,在第一方面的某些实现方式中,所述根据所述第一特征集合,得到所述第一特征集合在
BEV
空间内的第二特征集合,包括:
[0015]通过提取所述第一特征集合中所述第一特征数据在所述
BEV
空间内的第二特征数据,得到所述第二特征集合

[0016]结合第一方面,在第一方面的某些实现方式中,所述根据所述目标特征数据,得到目标检测结果,包括:
[0017]通过从所述目标特征数据中提取出目标,得到所述目标检测结果

[0018]结合第一方面,在第一方面的某些实现方式中,所述通过提取所述第一特征集合中所述第一特征数据在所述
BEV
空间内的第二特征数据,包括:
[0019]根据可移动设备的运动轨迹,将历史
BEV
查询向量与当前图片的
BEV
查询向量对齐;
[0020]通过将对齐后的所述历史
BEV
查询向量与所述当前图片的
BEV
查询向量融合,得到
BEV
特征的查询向量;
[0021]根据所述
BEV
特征的查询向量,得到
BEV
空间中网格的预测高度;
[0022]由所述
BEV
空间中网格的预测高度和所述网格的空间位置经过相机内外参投影到当前图片,得到参考点;
[0023]根据所述参考点

所述
BEV
特征的查询向量和所述第一特征集合中与所述当前图片对应的所述第一特征数据,得到所述图片的第二特征数据

本专利技术实施例对高度显式建模,提升检测的精度

[0024]结合第一方面,在第一方面的某些实现方式中,所述根据所述第二特征集合得到目标特征数据,包括:
[0025]通过将所述第二特征集合通过多个串联的编码器层,得到所述目标特征数据

[0026]结合第一方面,在第一方面的某些实现方式中,所述将所述第二特征集合通过多个串联的编码器层,得到所述目标特征数据,包括:
[0027]将所述第二特征集合通过所述多个串联的编码器层中的第一个编码器层,得到第一输出数据;
[0028]将所述第一输出数据通过所述多个串联的编码器层中除所述第一个编码器层以外的多个串联的编码器层,得到所述目标特征数据

[0029]结合第一方面,在第一方面的某些实现方式中,所述将所述第二特征集合通过所述多个串联的编码器层中的第一个编码器层,得到第一输出数据,包括:
[0030]将所述第二特征集合中的第二特征数据进行融合,得到第三特征数据;
[0031]通过对第三特征数据进行背景特征过滤处理,得到第四特征数据;
[0032]通过将所述第四特征数据和所述
BEV
特征的查询向量之和通过
LayerNorm
层,得到第五特征数据;
[0033]通过将所述第五特征数据通过多个
MLP
网络层,得到第六特征数据;
[0034]通过将所述第五特征数据和所述第六特征数据之和通过所述
LayerNorm
层,得到所述第一输出数据

本专利技术实施例对高度不确定性建模,在高度的预测过程中过滤背景部分的
BEV
特征,提升检测的精度

[0035]结合第一方面,在第一方面的某些实现方式中,所述可移动设备包括车辆

[0036]结合第一方面,在第一方面的某些实现方式中,所述目标包括人

车和障碍物中的一项或任意组合

[0037]第二方面,本专利技术实施例提供了一种电子设备,包括处理器和存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,当所述处理器运行所述程序指令时,使所述电子设备执行如上述所述的方法的步骤

[0038]第三方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储
介质存储有计算机程序,所述计算机程序包括程序指令,当所述程序请求被计算机运行时使所述计算机执行如上述所述的方法

[0039]第四方面,本专利技术实施例提供了一种计算机程序产品,所述计算机程序产品包含指令,当所述计算机程序产品在计算机或任一至少一种处理器上运本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种目标检测方法,其特征在于,所述方法包括:根据输入数据,得第一特征集合;根据所述第一特征集合,得到所述第一特征集合在
BEV
空间内的第二特征集合;根据所述第二特征集合得到目标特征数据;根据所述目标特征数据,得到目标检测结果
。2.
根据权利要求1所述的方法,其特征在于,所述根据输入数据,得第一特征集合之前,还包括:接收所述输入数据
。3.
根据权利要求1或2所述的方法,其特征在于,所述输入数据包括可移动设备的多路相机采集的多个图片
。4.
根据权利要求3所述的方法,其特征在于,所述第一特征集合包括所述输入数据中每个图片的第一特征数据
。5.
根据权利要求1‑4中任一项所述的方法,其特征在于,所述根据输入数据,得第一特征集合,包括:通过骨干网络提取所述输入数据的所述第一特征数据,得到所述第一特征集合
。6.
根据权利要求1‑5中任一项所述的方法,其特征在于,所述根据所述第一特征集合,得到所述第一特征集合在
BEV
空间内的第二特征集合,包括:通过提取所述第一特征集合中所述第一特征数据在所述
BEV
空间内的第二特征数据,得到所述第二特征集合
。7.
根据权利要求1‑6中任一项所述的方法,其特征在于,所述根据所述目标特征数据,得到目标检测结果,包括:通过从所述目标特征数据中提取出目标,得到所述目标检测结果
。8.
根据权利要求6所述的方法,其特征在于,所述通过提取所述第一特征集合中所述第一特征数据在所述
BEV
空间内的第二特征数据,包括:根据可移动设备的运动轨迹,将历史
BEV
查询向量与当前图片的
BEV
查询向量对齐;通过将对齐后的所述历史
BEV
查询向量与所述当前图片的
BEV
查询向量融合,得到
BEV
特征的查询向量;根据所述
BEV
特征的查询向量,得到
BEV
空间中网格的预测高度;由所述
BEV
空间中网格的预测高度和所述网格的空间位置经过相机内外参投影到当前图片,得到参考点;根据所述参考点

所述
B...

【专利技术属性】
技术研发人员:王宪赵昕海吴一鸣黎睿翔秦泽群李玺
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1