对象检测方法、装置、电子设备和存储介质制造方法及图纸

技术编号:36092070 阅读:17 留言:0更新日期:2022-12-24 11:09
本公开提供了一种对象检测方法、装置、电子设备和存储介质,可以应用于人工智能技术领域和自动驾驶技术领域。该方法包括:获取待检测图像,其中,待检测图像由目标相机拍摄得到,待检测图像的图像数据包括颜色域数据和深度数据;对颜色域数据进行特征提取,得到第一图像特征;利用目标相机的相机参数处理深度数据,得到第二图像特征;以及将第一图像特征和第二图像特征输入对象检测模型中,得到待检测图像的对象检测结果。图像的对象检测结果。图像的对象检测结果。

【技术实现步骤摘要】
对象检测方法、装置、电子设备和存储介质


[0001]本公开涉及人工智能
和自动驾驶
,更具体地,涉及一种对象检测方法、装置、电子设备、存储介质和计算机程序产品。

技术介绍

[0002]在自动驾驶场景下,自动驾驶车辆不仅需要识别障碍物的类型,还需要识别障碍物的精确位置和朝向,以提供信息给规划控制模块,规划出合理的路线。由于自动驾驶车辆通常使用相机作为信息获取端,因此,在进行障碍物识别之前,不可避免地要对相机拍摄的图像中的三维对象进行检测。
[0003]在相关技术中,图像中三维对象的检测通常是基于图像的语义信息进行的,相机参数未参与模型的训练。因此,相关技术中的对象检测模型无法修正不同相机之间的相机参数的差异,其检测精度较低。

技术实现思路

[0004]有鉴于此,本公开提供了一种对象检测方法、装置、电子设备、可读存储介质和计算机程序产品。
[0005]本公开的一个方面提供了一种对象检测方法,包括:
[0006]获取待检测图像,其中,上述待检测图像由目标相机拍摄得到,上述待检测图像的图像数据包括颜色域数据和深度数据;对上述颜色域数据进行特征提取,得到第一图像特征;利用上述目标相机的相机参数处理上述深度数据,得到第二图像特征;以及将上述第一图像特征和上述第二图像特征输入对象检测模型中,得到上述待检测图像的对象检测结果。
[0007]根据本公开的实施例,上述利用上述目标相机的相机参数处理上述深度数据,得到第二图像特征,包括:基于上述深度数据,生成与上述待检测图像对应的视锥体;以及基于上述目标相机的相机参数,对上述视锥体进行投影处理,得到上述第二图像特征。
[0008]根据本公开的实施例,上述基于上述目标相机的相机参数,对上述视锥体进行投影处理,得到上述第二图像特征,包括:对上述视锥体进行网格采样,得到采样矩阵;对于上述采样矩阵中的每一个矩阵元素,基于上述相机参数来将上述矩阵元素投影到预设坐标系中,得到与上述矩阵元素对应的坐标值;以及基于分别与上述采样矩阵的多个上述矩阵元素一一对应的多个上述坐标值,确定上述第二图像特征。
[0009]根据本公开的实施例,上述采样矩阵中的上述矩阵元素为列向量;其中,上述基于上述相机参数来将上述矩阵元素投影到预设坐标系中,得到与上述矩阵元素对应的坐标值,包括:基于上述相机参数,生成投影矩阵,其中,上述投影矩阵的维度与上述矩阵元素的维度相等;以及将上述矩阵元素与上述投影矩阵的逆矩阵相乘,得到上述坐标值。
[0010]根据本公开的实施例,上述将上述第一图像特征和上述第二图像特征输入对象检测模型中,得到上述待检测图像的对象检测结果,包括:对上述第一图像特征和上述第二图
像特征进行特征融合,得到第三图像特征;将上述第三图像特征输入上述对象检测模型中,得到输出特征;以及对上述输出特征进行解码,得到上述待检测图像的对象检测结果。
[0011]根据本公开的实施例,上述对上述第一图像特征和上述第二图像特征进行特征融合,得到第三图像特征,包括:将上述第一图像特征和上述第二图像特征按通道维度进行拼接,以得到上述第三图像特征。
[0012]本公开的另一个方面提供了一种对象检测装置,包括:
[0013]获取模块,用于获取待检测图像,其中,上述待检测图像由目标相机拍摄得到,上述待检测图像的图像数据包括颜色域数据和深度数据;特征提取模块,用于对上述颜色域数据进行特征提取,得到第一图像特征;处理模块,用于利用上述目标相机的相机参数处理上述深度数据,得到第二图像特征;以及检测模块,用于将上述第一图像特征和上述第二图像特征输入对象检测模型中,得到上述待检测图像的对象检测结果。
[0014]本公开的另一方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个指令,其中,当上述一个或多个指令被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如上所述的方法。
[0015]本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,上述指令在被执行时用于实现如上所述的方法。
[0016]本公开的另一方面提供了一种计算机程序产品,上述计算机程序产品包括计算机可执行指令,上述指令在被执行时用于实现如上所述的方法。
[0017]根据本公开的实施例,在对目标相机拍摄的待检测图像进行对象检测时,利用目标相机的相机参数处理待检测图像的深度数据,以将相机参数嵌入位置信息中,得到第二图像特征,并将第二图像特征与基于待检测图像的颜色域数据提取得到的第一图像特征输入到对象检测模型中,得到对象检测结果,使得对象检测模型实现了对相机参数的感知,可以取得更好的预测表现。通过上述技术手段,至少部分地克服了相关技术中因对象检测模型无法修正不同相机之间的相机参数的差异而导致的对象检测精度较低的技术问题,将相机参数作为模型的补充特征,令模型在预测阶段能够显式地感知到相机参数,有效提高了模型预测效果和对象检测精度。
附图说明
[0018]通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
[0019]图1示意性示出了根据本公开实施例的可以应用对象检测方法和装置的示例性系统架构。
[0020]图2示意性示出了根据本公开实施例的对象检测方法的流程图。
[0021]图3示意性示出了根据本公开实施例的深度数据处理方法的流程图。
[0022]图4示意性示出了根据本公开实施例的图像特征处理方法的流程图。
[0023]图5示意性示出了根据本公开实施例的对象检测流程的示意图。
[0024]图6示意性示出了根据本公开的实施例的对象检测装置的框图。
[0025]图7示意性示出了根据本公开实施例的适于实现对象检测方法的电子设备的框图。
具体实施方式
[0026]以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
[0027]在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
[0028]在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
[0029]在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象检测方法,包括:获取待检测图像,其中,所述待检测图像由目标相机拍摄得到,所述待检测图像的图像数据包括颜色域数据和深度数据;对所述颜色域数据进行特征提取,得到第一图像特征;利用所述目标相机的相机参数处理所述深度数据,得到第二图像特征;以及将所述第一图像特征和所述第二图像特征输入对象检测模型中,得到所述待检测图像的对象检测结果。2.根据权利要求1所述的方法,其中,所述利用所述目标相机的相机参数处理所述深度数据,得到第二图像特征,包括:基于所述深度数据,生成与所述待检测图像对应的视锥体;以及基于所述目标相机的相机参数,对所述视锥体进行投影处理,得到所述第二图像特征。3.根据权利要求2所述的方法,其中,所述基于所述目标相机的相机参数,对所述视锥体进行投影处理,得到所述第二图像特征,包括:对所述视锥体进行网格采样,得到采样矩阵;对于所述采样矩阵中的每一个矩阵元素,基于所述相机参数来将所述矩阵元素投影到预设坐标系中,得到与所述矩阵元素对应的坐标值;以及基于分别与所述采样矩阵的多个所述矩阵元素一一对应的多个所述坐标值,确定所述第二图像特征。4.根据权利要求3所述的方法,其中,所述采样矩阵中的所述矩阵元素为列向量;其中,所述基于所述相机参数来将所述矩阵元素投影到预设坐标系中,得到与所述矩阵元素对应的坐标值,包括:基于所述相机参数,生成投影矩阵,其中,所述投影矩阵的维度与所述矩阵元素的维度相等;以及将所述矩阵元素与所述投影矩阵的逆矩阵相乘,得到所述坐标值。5.根据权利要求1所述的方法,其中,所述将所述第一图像特征和所...

【专利技术属性】
技术研发人员:姚卓坤
申请(专利权)人:北京京东尚科信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1