【技术实现步骤摘要】
三维物体检测方法、装置、设备及存储介质
[0001]本申请涉及图像处理
,具体涉及计算机视觉技术。
技术介绍
[0002]物体检测是计算机视觉领域的重要研究方向。目前,物体检测主要包括二维物体检测和三维物体检测。其中,二维物体检测通常是在图像中识别和定位到物体后,紧紧围绕物体圈出一个矩形框来表示物体在图像中所在位置。三维物体检测通过识别和定位三维物体,得到物体的三维信息,紧紧围绕物体圈出一个立方体框来表示物体在真实世界中的位置。三维物体检测在智能机器人、自动驾驶、虚拟现实及增强现实等领域都有着重要的应用价值。
技术实现思路
[0003]本申请实施例提供了一种三维物体检测方法、装置、设备、介质及程序产品,以提高基于单帧图像的三维物体检测精度。
[0004]第一方面,本申请实施例提供了一种三维物体检测方法,包括:
[0005]获取待检测的单帧彩色图像;
[0006]获取所述单帧彩色图像的前景物体特征和物体约束特征;
[0007]根据所述前景物体特征和所述物体约束特征对所述单帧彩色图像进行三维物体检测。
[0008]第二方面,本申请实施例提供了一种三维物体检测装置,包括:
[0009]单帧彩色图像获取模块,用于获取待检测的单帧彩色图像;
[0010]特征获取模块,用于获取所述单帧彩色图像的前景物体特征和物体约束特征;
[0011]三维物体检测模块,用于根据所述前景物体特征和所述物体约束特征对所述单帧彩色图像进行三维物体检测。
[0 ...
【技术保护点】
【技术特征摘要】
1.一种三维物体检测方法,包括:获取待检测的单帧彩色图像;获取所述单帧彩色图像的前景物体特征和物体约束特征;根据所述前景物体特征和所述物体约束特征对所述单帧彩色图像进行三维物体检测。2.根据权利要求1所述的方法,其中,所述获取所述单帧彩色图像的前景物体特征,包括:将所述单帧彩色图像输入至深度特征估计网络;获取所述深度特征估计网络的第一输出数据,作为所述单帧彩色图像的深度图像特征;将所述深度图像特征输入至两层全连接神经网络;获取所述两层全连接神经网络的第二输出数据,作为热力分布特征;根据所述深度图像特征和所述热力分布特征获取所述前景物体特征。3.根据权利要求2所述的方法,其中,所述根据所述深度图像特征和所述热力分布特征获取所述前景物体特征,包括:根据所述热力分布特征确定前景物体对象;获取所述前景物体对象的坐标位置数据;根据所述坐标位置数据从所述深度图像特征中提取目标深度图像特征,作为目标前景物体特征;根据所述目标前景物体特征构建所述前景物体特征。4.根据权利要求1所述的方法,其中,所述获取所述单帧彩色图像的物体约束特征,包括:将所述前景物体特征输入至物体级别transformer网络;获取所述物体级别transformer网络的第三输出数据;将所述第三输出数据输入至两层全连接神经网络,得到第四输出数据;将所述第四输出数据作为所述物体约束特征。5.根据权利要求4所述的方法,其中,所述获取所述物体级别transformer网络的第三输出数据,包括:将所述前景物体特征输入至所述物体级别transformer网络的物体编码器;获取所述物体编码器的编码输出结果,并将所述编码输出结果输入至所述物体级别transformer网络的物体译码器;获取所述物体译码器的译码输出结果,作为所述第三输出数据。6.根据权利要求5所述的方法,其中,所述获取所述物体编码器的编码输出结果,包括:根据所述前景物体特征和二维位置信息编码获取第一物体特征向量;将所述第一物体特征向量输入至所述物体编码器的第一多头注意力模块,得到第一注意力模块输出数据;将所述第一注意力模块输出数据与所述第一物体特征向量进行相加处理,得到第一相加处理结果,并对所述第一相加处理结果进行归一化处理,得到第一归一化输出数据;将所述第一归一化输出数据输入至所述物体编码器的前向网络,得到第一前向网络输出数据;
将所述第一归一化输出数据和所述第一前向网络输出数据进行相加处理,得到第二相加处理结果,并对所述第二相加处理结果再次进行归一化处理,得到所述编码输出结果。7.根据权利要求5所述的方法,其中,所述获取所述物体编码器的编码输出结果,包括:根据初始物体向量和二维位置信息编码获取第二物体特征向量;将所述第二物体特征向量输入至所述物体译码器的第二多头注意力模块,得到第二注意力模块输出数据;将所述第二注意力模块输出数据与所述第二物体特征向量进行相加处理,得到第三相加处理结果,并对所述第三相加处理结果进行归一化处理,得到第三归一化输出数据;将所述第三归一化输出数据和所述编码输出结果输入至所述物体译码器的第三多头注意力模块,得到第三注意力模块输出数据;将所述第三注意力模块输出数据与所述第三归一化输出数据进行相加处理,得到第四相加处理结果,并对所述第四相加处理结果进行归一化处理,得到第四归一化输出数据;将所述第四归一化输出数据输入至所述物体译码器的前向网络,得到第二前向网络输出数据;将所述第四归一化输出数据和所述第二前向网络输出数据进行相加处理,得到第五相加处理结果,并对所述第五相加处理结果再次进行归一化处理,得到所述译码输出结果。8.根据权利要求1所述的方法,其中,所述根据所述前景物体特征和所述物体约束特征对所述单帧彩色图像进行三维物体检测,包括:对所述前景物体特征和所述物体约束特征进行特征融合,得到融合图像特征;将所述融合图像特征输入至两层全连接神经网络;获取所述两层全连接神经网络的输出回归数据;根据所述输出回归数据对所述单帧彩色图像进行三维物体检测。9.根据权利要求8所述的方法,其中,所述对所述前景物体特征和所述物体约束特征进行特征融合,包括:确定物体约束特征权重;根据所述物体约束特征权重和所述物体约束特征确定待融合物体约束特征;将所述前景物体特征和所述待融合物体约束特征进行特征相加融合处理,得到所述融合图像特征;或将所述前景物体特征和所述物体约束特征进行特征拼接融合处理,得到所述融合图像特征。10.根据权利要求8所述的方法,其中,所述输出回归数据包括物体三维尺寸、物体方向角度、物体中心点位置以及物体中心点深度;所述根据所述输出回归数据对所述单帧彩色图像进行三维物体检测,包括:根据所述输出回归数据确定所述单帧彩色图像中各物体对应的三维包围框;根据所述三维包围框对各所述物体进行标识。11.一种三维物体检测装置,包括:单帧彩色图像获取模块,用于获取待检测的单帧彩色图像;特征获取模块,用于获取所述单帧彩色图像的前景物体特征和物体约束特征;三维物体检测模块,用于根据所述前景物体特征和所述物体约束特征对所述单...
【专利技术属性】
技术研发人员:周定富,宋希彬,方进,张良俊,
申请(专利权)人:百度美国有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。