基于视频的目标对象识别方法、装置、车辆及路侧设备制造方法及图纸

技术编号:29976777 阅读:25 留言:0更新日期:2021-09-08 10:02
本公开提供了一种基于视频的目标对象识别方法、装置、车辆及路侧设备,涉及人工智能领域,具体涉及计算机视觉和深度学习技术,具体可用于智慧城市和智能交通场景下。方法包括:获取视频中的多帧初始图像,根据每帧初始图像中的各目标对象,对多帧初始图像进行图像拼接,得到拼接图像,对拼接图像进行特征提取,得到图像特征,并根据图像特征识别多帧初始图像中的各目标对象的属性信息,通过在特征提取之前,对各帧初始图像进行拼接,以便在特征提取时,对拼接得到的拼接图像进行特征提取即可,无需对各帧初始图像分别进行特征提取的操作,避免了特征提取的冗余,节约了用于特征提取的资源和时间,且提高了识别的效率的技术效果。且提高了识别的效率的技术效果。且提高了识别的效率的技术效果。

【技术实现步骤摘要】
基于视频的目标对象识别方法、装置、车辆及路侧设备


[0001]本公开涉及人工智能领域,具体涉及计算机视觉和深度学习技术,尤其涉及一种基于视频的目标对象识别方法、装置、车辆及路侧设备,具体可用于智慧城市和智能交通场景下。

技术介绍

[0002]人工智能已经在无人驾驶、人脸识别、医学图像处理等应用场景得到了广泛的应用,而在这些应用场景中,可以利用目标检测技术检测视频监控中出现的目标对象,如车辆等。
[0003]在现有技术中,基于视频的目标对象识别方法包括:获取待检测视频中的每一帧图像,对每一帧图像进行特征提取,得到每一帧图像的图像特征,并将各图像特征输入至预先训练的对象识别模型,对象识别模型用于根据各图像特征识别得到目标对象的属性信息。
[0004]然而,采用上述方法,对每一帧图像均需要进行特征提取,容易造成过程繁琐,资源消耗偏高的技术问题。

技术实现思路

[0005]本公开提供了一种用于减少资源消耗的基于视频的目标对象识别方法、装置、车辆及路侧设备。
[0006]根据本公开的第一方面,提供了一种基于视频的目本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于视频的目标对象识别方法,包括:获取视频中的多帧初始图像,其中,每帧所述初始图像中包括至少一个目标对象;根据每帧所述初始图像中的各目标对象,对所述多帧初始图像进行图像拼接,得到拼接图像,其中,所述拼接图像中包括各帧所述初始图像中的各目标对象;对所述拼接图像进行特征提取,得到图像特征,并根据所述图像特征识别所述多帧初始图像中的各目标对象的属性信息。2.根据权利要求1所述的方法,其中,根据每帧所述初始图像中的各目标对象,对所述多帧初始图像进行图像拼接,得到拼接图像,包括:确定每一所述初始图像中各目标对象的各目标像素点的属性信息;根据每一所述目标像素点的属性信息,对所述多帧初始图像进行图像拼接,得到所述拼接图像。3.根据权利要求2所述的方法,其中,所述多帧初始图像的帧数为N,N为大于1的正整数,i的初始值为1,i为大于等于1、且小于等于N的正整数;根据每一所述目标像素点的属性信息,对所述多帧初始图像进行图像拼接,得到所述拼接图像,包括:重复以下步骤,直至i的取值为N:以第i帧初始图像为基础图像,根据所述多帧初始图像中的第i帧初始图像中各目标对象的每一目标像素点的属性信息、第i+1帧初始图像中各目标对象的每一目标像素点的属性信息,将所述第i+1帧初始图像拼接至第i帧初始图像上,得到调整图像;将所述调整图像作为新的第i+1帧初始图像,将i累加1;其中,在i的取值为N时,所得到的调整图像为所述拼接图像。4.根据权利要求3所述的方法,其中,以所述第i帧初始图像为基础图像,根据所述多帧初始图像中的第i帧初始图像中各目标对象的每一目标像素点的属性信息、第i+1帧初始图像中各目标对象的每一目标像素点的属性信息,将所述第i+1帧初始图像拼接至第i帧初始图像上,得到调整图像,包括:根据所述多帧初始图像中的第i帧初始图像中各目标对象的每一目标像素点的属性信息、第i+1帧初始图像中各目标对象的每一目标像素点的属性信息,确定所述第i+1帧初始图像与所述第i帧初始图像中的不相同目标像素点;以所述第i帧初始图像为基础图像,根据所述不相同目标像素点,将所述第i+1帧初始图像拼接至第i帧初始图像上,得到调整图像。5.根据权利要求3所述的方法,其中,以所述第i帧初始图像为基础图像,根据所述多帧初始图像中的第i帧初始图像中各目标对象的每一目标像素点的属性信息、第i+1帧初始图像中各目标对象的每一目标像素点的属性信息,将所述第i+1帧初始图像拼接至第i帧初始图像上,得到调整图像,包括:将所述第i+1帧初始图像叠加至第i帧初始图像上,得到叠加图像;根据所述多帧初始图像中的第i帧初始图像中各目标对象的每一目标像素点的属性信息、第i+1帧初始图像中各目标对象的每一目标像素点的属性信息,确定所述第i+1帧初始图像与第i帧初始图像的相同目标像素点,并在所述叠加图像中对所述相同目标像素点进行去冗余处理,得到所述拼接图像。6.根据权利要求2至5中任一项所述的方法,其中,目标像素点的属性信息包括:目标像
素点的时间信息和/或目标像素点的坐标信息。7.根据权利要求6所述的方法,其中,所述目标像素点的坐标信息为横坐标信息或者纵坐标信息。8.根据权利要求1至7中任一项所述的方法,其中,根据所述图像特征识别所述多帧初始图像中的各目标对象的属性信息,包括:确定多帧所述初始图像的位置编码,所述位置编码用于表征:每一帧所述初始图像相对于所述视频的整体时长的时间信息、每一帧所述初始图像相对于所述视频的整体位置的位置信息;根据所述图像特征和所述位置编码识别所述多帧初始图像中的各目标对象的属性信息。9.根据权利要求8所述的方法,其中,确定多帧所述初始图像的位置编码,包括:获取每一帧所述初始图像上的每一目标对象的各目标像素点的目标像素坐标,并获取每一帧所述初始图像的形成时间;针对任意帧初始图像,确定所述任意帧初始图像的各目标像素坐标相对于各帧所述初始图像的各目标像素坐标的位置信息,并确定所述任意帧初始图像相对于各帧所述初始图像的形成时间的时间信息;根据所述任意帧初始图像的各目标像素坐标相对于各帧所述初始图像的各目标像素坐标的位置信息、所述任意帧初始图像相对于各帧所述初始图像的形成时间的时间信息,确定所述位置编码。10.根据权利要求1至9中任一项所述的方法,其中,对所述拼接图像进行特征提取,得到图像特征,并根据所述图像特征识别所述多帧初始图像中的各目标对象的属性信息,包括:将所述拼接图像输入至预先训练的backbone模型中,得到所述拼接图像的图像特征,所述backbone模型用于对输入的图像进行特征提取;将所述图像特征输入至预先训练的transformer模型,由transformer模型根据所述图像特征识别得到各所述目标对象的属性信息。11.一种基于视频的目标对象识别装置,包括:获取单元,用于获取视频中的多帧初始图像,其中,每帧所...

【专利技术属性】
技术研发人员:杨喜鹏蒋旻悦谭啸孙昊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1