目标跟踪方法及装置制造方法及图纸

技术编号:17442374 阅读:31 留言:0更新日期:2018-03-10 15:11
本公开是关于一种目标跟踪方法及装置。该方法包括:检测多个视频帧中的运动物体;根据多个视频帧中的运动物体确定跟踪的目标;提取所述目标的特征,并根据所述目标的特征训练卷积神经网络分类模型中的目标相关部分,其中,所述卷积神经网络分类模型中的目标无关部分采用预先训练的参数;对于当前跟踪的视频帧,以所述当前跟踪的视频帧的上一视频帧中的目标位置为中心,确定所述当前跟踪的视频帧中的候选区域;通过所述卷积神经网络分类模型从所述当前跟踪的视频帧中的各个候选区域中确定所述当前跟踪的视频帧中的目标区域。本公开能够针对不同视频中不同的目标进行跟踪,提高了目标跟踪的成功率。

【技术实现步骤摘要】
目标跟踪方法及装置
本公开涉及计算机视觉
,尤其涉及目标跟踪方法及装置。
技术介绍
视频目标跟踪是指对视频中的运动物体(例如行人、汽车等)进行跟踪,得到该运动物体在每一帧的位置。目标跟踪在视频监控、自动驾驶和视频娱乐等领域有着广泛的应用。传统的目标跟踪方法包括光流(OpticalFlow)法和粒子滤波(PF,ParticleFilter)法。这两种目标跟踪方法基于简单的颜色模型或人工特征来进行跟踪,在遮挡、强光等情况下容易出现跟踪失败的结果。目前,通常基于卷积神经网络(CNN,ConvolutionalNeuralNetwork)来进行目标跟踪。相关技术中的基于卷积神经网络的目标跟踪方法大多是基于图片分类来实现的。由于不同的视频或图像序列中的跟踪目标是不同的(例如某个物体在一个视频中是跟踪的目标,在另一个视频中则只是背景),因此,要想用一个卷积神经网络分类模型来完成所有类型的视频或图像序列中前景和背景的区分任务,是比较困难的。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种目标跟踪方法及装置。根据本公开实施例的第一方面,提供一种目标跟踪方法,包括:检测多个视频帧中的运动物体;根据多个视频帧中的运动物体确定跟踪的目标;提取所述目标的特征,并根据所述目标的特征训练卷积神经网络分类模型中的目标相关部分,其中,所述卷积神经网络分类模型中的目标无关部分采用预先训练的参数;对于当前跟踪的视频帧,以所述当前跟踪的视频帧的上一视频帧中的目标位置为中心,确定所述当前跟踪的视频帧中的候选区域;通过所述卷积神经网络分类模型从所述当前跟踪的视频帧中的各个候选区域中确定所述当前跟踪的视频帧中的目标区域。在一种可能的实现方式中,确定所述当前跟踪的视频帧中的候选区域,包括:采用高斯分布采样的方式,确定所述当前跟踪的视频帧中的候选区域。在一种可能的实现方式中,通过所述卷积神经网络分类模型从所述当前跟踪的视频帧中的各个候选区域中确定所述当前跟踪的视频帧中的目标区域,包括:通过所述卷积神经网络分类模型确定所述当前跟踪的视频帧中的各个候选区域中包含所述目标的概率;将所述当前跟踪的视频帧中的各个候选区域中包含所述目标的概率最大的候选区域作为所述当前跟踪的视频帧中的目标区域。在一种可能的实现方式中,所述方法还包括:根据所述目标在各个已跟踪的视频帧中的位置训练位置优化模型;根据所述位置优化模型对所述当前跟踪的视频帧中的目标区域进行优化。在一种可能的实现方式中,所述方法还包括:根据最近跟踪的N个视频帧中的目标图像,对所述卷积神经网络分类模型中的目标相关部分进行更新训练,其中,N为大于1的整数。根据本公开实施例的第二方面,提供一种目标跟踪装置,包括:检测模块,用于检测多个视频帧中的运动物体;第一确定模块,用于根据多个视频帧中的运动物体确定跟踪的目标;第一训练模块,用于提取所述目标的特征,并根据所述目标的特征训练卷积神经网络分类模型中的目标相关部分,其中,所述卷积神经网络分类模型中的目标无关部分采用预先训练的参数;第二确定模块,用于对于当前跟踪的视频帧,以所述当前跟踪的视频帧的上一视频帧中的目标位置为中心,确定所述当前跟踪的视频帧中的候选区域;第三确定模块,用于通过所述卷积神经网络分类模型从所述当前跟踪的视频帧中的各个候选区域中确定所述当前跟踪的视频帧中的目标区域。在一种可能的实现方式中,所述第二确定模块用于:对于当前跟踪的视频帧,以所述当前跟踪的视频帧的上一视频帧中的目标位置为中心,采用高斯分布采样的方式,确定所述当前跟踪的视频帧中的候选区域。在一种可能的实现方式中,所述第三确定模块包括:第一确定子模块,用于通过所述卷积神经网络分类模型确定所述当前跟踪的视频帧中的各个候选区域中包含所述目标的概率;第二确定子模块,用于将所述当前跟踪的视频帧中的各个候选区域中包含所述目标的概率最大的候选区域作为所述当前跟踪的视频帧中的目标区域。在一种可能的实现方式中,所述装置还包括:第二训练模块,用于根据所述目标在各个已跟踪的视频帧中的位置训练位置优化模型;优化模块,用于根据所述位置优化模型对所述当前跟踪的视频帧中的目标区域进行优化。在一种可能的实现方式中,所述装置还包括:第三训练模块,用于根据最近跟踪的N个视频帧中的目标图像,对所述卷积神经网络分类模型中的目标相关部分进行更新训练,其中,N为大于1的整数。根据本公开实施例的第三方面,提供一种目标跟踪装置,其特征在于,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行上述方法。根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器执行时,使得处理器能够执行上述方法。本公开的实施例提供的技术方案可以包括以下有益效果:通过将卷积神经网络分类模型分为目标相关部分和目标无关部分,目标相关部分根据目标的特征进行训练,目标无关部分采用预先训练的参数,由此能够针对不同视频中不同的目标进行跟踪,提高了目标跟踪的成功率。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的一种目标跟踪方法的流程图。图2是根据一示例性实施例示出的一种目标跟踪方法中目标的边界框的示意图。图3是根据一示例性实施例示出的一种目标跟踪方法步骤S15的一示例性的流程图。图4是根据一示例性实施例示出的一种目标跟踪方法的一示例性的流程图。图5是根据一示例性实施例示出的一种目标跟踪方法的一示例性的流程图。图6是根据一示例性实施例示出的一种目标跟踪装置的框图。图7是根据一示例性实施例示出的一种目标跟踪装置的一示例性的框图。图8是根据一示例性实施例示出的一种用于目标跟踪的装置800的框图。图9是根据一示例性实施例示出的一种用于目标跟踪的装置1900的框图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。图1是根据一示例性实施例示出的一种目标跟踪方法的流程图。该方法可以应用于终端中。如图1所示,该方法包括步骤S11至步骤S15。在步骤S11中,检测多个视频帧中的运动物体。作为本实施例的一个示例,可以每隔M帧进行一次运动物体的检测,其中,M为正整数。例如,在行人跟踪中,可以每隔M帧进行一次行人检测。在步骤S12中,根据多个视频帧中的运动物体确定跟踪的目标。图2是根据一示例性实施例示出的一种目标跟踪方法中目标的边界框的示意图。在步骤S13中,提取目标的特征,并根据目标的特征训练卷积神经网络分类模型中的目标相关部分,其中,卷积神经网络分类模型中的目标无关部分采用预先训练的参数。在本实施例中,卷积神经网络(CNN,ConvolutionalNeuralNetworks)分类模型包括目标相关部分和目标无关部分。目标相关部分和目标无关部分可以分别包括神经网络的若干层。例如本文档来自技高网...
目标跟踪方法及装置

【技术保护点】
一种目标跟踪方法,其特征在于,包括:检测多个视频帧中的运动物体;根据多个视频帧中的运动物体确定跟踪的目标;提取所述目标的特征,并根据所述目标的特征训练卷积神经网络分类模型中的目标相关部分,其中,所述卷积神经网络分类模型中的目标无关部分采用预先训练的参数;对于当前跟踪的视频帧,以所述当前跟踪的视频帧的上一视频帧中的目标位置为中心,确定所述当前跟踪的视频帧中的候选区域;通过所述卷积神经网络分类模型从所述当前跟踪的视频帧中的各个候选区域中确定所述当前跟踪的视频帧中的目标区域。

【技术特征摘要】
1.一种目标跟踪方法,其特征在于,包括:检测多个视频帧中的运动物体;根据多个视频帧中的运动物体确定跟踪的目标;提取所述目标的特征,并根据所述目标的特征训练卷积神经网络分类模型中的目标相关部分,其中,所述卷积神经网络分类模型中的目标无关部分采用预先训练的参数;对于当前跟踪的视频帧,以所述当前跟踪的视频帧的上一视频帧中的目标位置为中心,确定所述当前跟踪的视频帧中的候选区域;通过所述卷积神经网络分类模型从所述当前跟踪的视频帧中的各个候选区域中确定所述当前跟踪的视频帧中的目标区域。2.根据权利要求1所述的方法,其特征在于,确定所述当前跟踪的视频帧中的候选区域,包括:采用高斯分布采样的方式,确定所述当前跟踪的视频帧中的候选区域。3.根据权利要求1所述的方法,其特征在于,通过所述卷积神经网络分类模型从所述当前跟踪的视频帧中的各个候选区域中确定所述当前跟踪的视频帧中的目标区域,包括:通过所述卷积神经网络分类模型确定所述当前跟踪的视频帧中的各个候选区域中包含所述目标的概率;将所述当前跟踪的视频帧中的各个候选区域中包含所述目标的概率最大的候选区域作为所述当前跟踪的视频帧中的目标区域。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据所述目标在各个已跟踪的视频帧中的位置训练位置优化模型;根据所述位置优化模型对所述当前跟踪的视频帧中的目标区域进行优化。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据最近跟踪的N个视频帧中的目标图像,对所述卷积神经网络分类模型中的目标相关部分进行更新训练,其中,N为大于1的整数。6.一种目标跟踪装置,其特征在于,包括:检测模块,用于检测多个视频帧中的运动物体;第一确定模块,用于根据多个视频帧中的运动物体确定跟踪的目标;第一训练模块,用于提取所述目标的特征,并根据所述目标的特征训练卷积神...

【专利技术属性】
技术研发人员:杨松
申请(专利权)人:北京小米移动软件有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1