【技术实现步骤摘要】
目标对象检测方法、装置、电子设备和存储介质
[0001]本公开涉及人工智能
,尤其涉及计算机视觉、图像识别和深度学习技术,具体涉及一种目标对象检测方法、装置、电子设备、存储介质和计算机程序产品。
技术介绍
[0002]在智能交通、自动驾驶等场景中,在基于二维图像对场景中的物体进行结构化分析时,需要分别估计物体的3D位置信息和运动状态信息。但是,由于没有考虑到3D位置信息和运动状态信息之间的关联性,导致效率低下,而且预测精度较低。
技术实现思路
[0003]本公开提供了一种目标对象检测方法、装置、电子设备、存储介质和计算机程序产品。
[0004]根据本公开的一方面,提供了一种目标对象检测方法,包括:根据视频流中的当前帧图像、当前帧图像的关联语义信息以及当前帧图像的深度信息,确定当前帧图像的多个多尺度特征图;对多个多尺度特征图进行多尺度融合处理,得到多个多尺度融合特征图;根据多个多尺度融合特征图和当前帧图像的第一全局上下文特征,确定时空融合特征图;以及根据时空融合特征图,检测当前帧图像中的目标对象。 ...
【技术保护点】
【技术特征摘要】
1.一种目标对象检测方法,包括:根据视频流中的当前帧图像、所述当前帧图像的关联语义信息以及所述当前帧图像的深度信息,确定所述当前帧图像的多个多尺度特征图;对所述多个多尺度特征图进行多尺度融合处理,得到多个多尺度融合特征图;根据所述多个多尺度融合特征图和所述当前帧图像的第一全局上下文特征,确定时空融合特征图;以及根据所述时空融合特征图,检测所述当前帧图像中的目标对象。2.根据权利要求1所述的方法,其中,所述当前帧图像为第t帧图像,t为大于1的整数;所述方法还包括:针对所述多个多尺度融合特征图中的目标多尺度融合特征图,确定针对第t帧图像的第二全局上下文特征;以及根据所述第二全局上下文特征,确定所述目标多尺度融合特征图的目标时空融合特征图。3.根据权利要求2所述的方法,其中,针对所述多个多尺度融合特征图中的多尺度融合特征图,确定第t帧图像的第二全局上下文特征包括:根据目标多尺度融合特征图,确定第一特征和第二特征;以及根据所述第一特征和第二特征,确定第二全局上下文特征。4.根据权利要求3所述的方法,还包括:根据第t帧图像的第二全局上下文特征至第t
‑
i帧图像的第二全局上下文特征,确定所述当前帧图像的第一全局上下文特征,其中,i为大于等于2的整数。5.根据权利要求2
‑
4中任一项所述的方法,其中,根据所述第二全局上下文特征,确定所述目标多尺度融合特征图的目标时空融合特征图包括:根据所述目标多尺度融合特征图,确定第三特征和第四特征;以及根据所述第三特征、所述第四特征和所述当前帧图像的第一全局上下文特征,确定所述目标多尺度融合特征图的目标时空融合特征图。6.根据权利要求2所述的方法,其中,根据所述多个多尺度融合特征图和所述当前帧图像的第一全局上下文特征,确定时空融合特征图包括:根据所述多个多尺度融合特征图中除所述目标多尺度融合特征图以外的其他多尺度融合特征图和所述目标时空融合特征图,确定所述时空融合特征图。7.根据权利要求1所述的方法,其中,所述根据所述时空融合特征图,检测所述当前帧图像中的目标对象包括:根据所述时空融合特征图,确定所述目标对象的至少一个二维属性;以及根据所述至少一个二维属性,检测所述当前帧图像中的目标对象。8.根据权利要求7所述的方法,其中,所述目标对象的至少一个二维属性包括以下中的至少一个:目标对象中心点热力图、2D包围框偏移量、帧间物体运动偏移量和帧内像素偏移量。9.根据权利要求7所述的方法,还包括:根据所述至少一个二维属性,确定所述目标对象的三维属性。10.根据权利要求9所述的方法,其中,所述目标对象的三维属性包括以下中的至少一
个:类别属性、朝向角属性、3D关键点属性和尺寸属性。11.根据权利要求1所述的方法,还包括:对所述当前帧图像的在前帧图像进行处理,得到在前帧图像的语义分割信息;以及将所述在前帧图像的语义分割信息作为所述关联语义信息。12.一种目标对象检测装置,包括:第一确定模块,用于根据视频流中的当前帧图像、所述当前帧图像的关联语义信息以及所述当前帧图像的深度信息,确定所述当前帧图像的多个多尺度特征图;第一融合模块,用于对所述多个多尺度特征图进行多尺度融合处理,得到多个多尺度融合特征图;第二确定模块,用于根据所述多个多尺度融合特征图和...
【专利技术属性】
技术研发人员:谭啸,张伟,叶晓青,时一峰,孙昊,王井东,丁二锐,吴甜,王海峰,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。