对象跟踪方法、装置、设备及存储介质制造方法及图纸

技术编号:23213697 阅读:24 留言:0更新日期:2020-01-31 22:11
本申请公开了一种对象跟踪方法、装置、设备及存储介质,属于计算机技术领域。所述方法包括:将第一视频帧、第二视频帧以及初始位置信息输入至第一神经网络,获取第一神经网络输出的预测动作信息;将第一视频帧、第二视频帧、初始位置信息和预测动作信息输入至第二神经网络,获取第二神经网络输出的第一概率信息,第一概率信息用于指示根据预测动作信息得到的目标对象在第二视频帧中的预测位置准确的概率;当第一概率信息指示的概率大于等于预设概率阈值时,根据预测动作信息获取目标对象在第二视频帧中的预测位置。本申请实施例提供的技术方案可以对视频中的对象进行跟踪。

Object tracking method, device, equipment and storage medium

【技术实现步骤摘要】
对象跟踪方法、装置、设备及存储介质
本申请涉及计算机
,特别是涉及一种对象跟踪方法、装置、设备及存储介质。
技术介绍
在许多实际的应用场景中,都有对视频中的对象进行跟踪的需求,所谓“对视频中的对象进行跟踪”指的是在确定某一对象在某一视频帧中的位置后,对该对象在后续视频帧中的位置进行预测,从而基于预测到的位置对该对象进行跟踪,以得到该对象的运动轨迹。例如,在安防领域,就存在着对监控视频中的嫌疑车辆或者嫌疑人进行跟踪的需求,以根据跟踪得到嫌疑车辆或者嫌疑人的运动轨迹,从而对该嫌疑车辆或者嫌疑人进行抓捕。其中,如何对视频中的对象进行跟踪以满足实际需求,已经成为了目前一个亟待解决的问题。
技术实现思路
基于此,本申请实施例提供了一种对象跟踪方法、装置、设备及存储介质,可以对视频中的对象进行跟踪。第一方面,提供了一种对象跟踪方法,该方法包括:将第一视频帧、第二视频帧以及初始位置信息输入至第一神经网络,获取该第一神经网络输出的预测动作信息,该第一视频帧和该第二视频帧在时序上相邻,该初始位置信息用于指示待跟踪的目标对本文档来自技高网...

【技术保护点】
1.一种对象跟踪方法,其特征在于,所述方法包括:/n将第一视频帧、第二视频帧以及初始位置信息输入至第一神经网络,获取所述第一神经网络输出的预测动作信息,所述第一视频帧和所述第二视频帧在时序上相邻,所述初始位置信息用于指示待跟踪的目标对象在所述第一视频帧中的位置,所述预测动作信息用于指示所述目标对象在所述第二视频帧中的预测位置与所述目标对象在所述第一视频帧中的位置的相对关系;/n将所述第一视频帧、所述第二视频帧、所述初始位置信息和所述预测动作信息输入至第二神经网络,获取所述第二神经网络输出的第一概率信息,所述第一概率信息用于指示根据所述预测动作信息得到的所述目标对象在所述第二视频帧中的预测位置准...

【技术特征摘要】
1.一种对象跟踪方法,其特征在于,所述方法包括:
将第一视频帧、第二视频帧以及初始位置信息输入至第一神经网络,获取所述第一神经网络输出的预测动作信息,所述第一视频帧和所述第二视频帧在时序上相邻,所述初始位置信息用于指示待跟踪的目标对象在所述第一视频帧中的位置,所述预测动作信息用于指示所述目标对象在所述第二视频帧中的预测位置与所述目标对象在所述第一视频帧中的位置的相对关系;
将所述第一视频帧、所述第二视频帧、所述初始位置信息和所述预测动作信息输入至第二神经网络,获取所述第二神经网络输出的第一概率信息,所述第一概率信息用于指示根据所述预测动作信息得到的所述目标对象在所述第二视频帧中的预测位置准确的概率;
当所述第一概率信息指示的概率大于等于预设概率阈值时,根据所述预测动作信息获取所述目标对象在所述第二视频帧中的预测位置。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述第一概率信息指示的概率小于所述预设概率阈值时,在所述第二视频帧中获取至少一个对象框,并获取所述对象框的位置信息;
根据所述对象框的位置信息和所述初始位置信息,获取所述对象框对应的动作信息,所述动作信息用于指示所述对象框的位置与所述目标对象在所述第一视频帧中的位置的相对关系;
将所述动作信息、所述第一视频帧、所述第二视频帧和所述初始位置信息输入至所述第二神经网络,获取所述第二神经网络输出的第二概率信息;
将目标第二概率信息对应的对象框的位置确定为所述目标对象在所述第二视频帧中的预测位置,所述目标第二概率信息指示的概率是所述第二概率信息中的最大值。


3.根据权利要求1所述的方法,其特征在于,所述将第一视频帧、第二视频帧以及初始位置信息输入至第一神经网络之前,所述方法还包括:
获取多个训练视频,对所述训练视频中的每个训练视频帧中的训练对象的位置进行标注,根据标注结果得到多个训练数组,其中,所述训练数组与训练视频帧相对应,所述训练数组包括当前位置信息、训练动作信息和下一位置信息,所述当前位置信息用于指示所述训练对象在所述训练数组对应的训练视频帧中的位置,所述下一位置信息用于指示所述训练对象在所述训练数组对应的训练视频帧的下一训练视频帧中的位置,所述训练动作信息用于指示所述当前位置信息指示的位置与所述下一位置信息指示的位置的相对关系;
基于所述多个训练数组对第一初始神经网络和第二初始神经网络进行训练,得到第一训练神经网络和第二训练神经网络;
将所述第一训练神经网络作为所述第一神经网络;
根据所述第二训练神经网络获取所述第二神经网络。


4.根据权利要求3所述的方法,其特征在于,所述基于所述多个训练数组对第一初始神经网络和第二初始神经网络进行训练之前,所述方法还包括:
基于已经训练好的VGG-M神经网络中的参数设置所述第一初始神经网络的初始参数和所述第二初始神经网络的初始参数,分别得到第一候选神经网络和第二候选神经网络;
所述基于所述多个训练数组对第一初始神经网络和第二初始神经网络进行训练,具体为:
基于所述多个训练数组对所述第一候选神经网络和所述第二候...

【专利技术属性】
技术研发人员:周康明丁子凡
申请(专利权)人:上海眼控科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1