目标跟踪方法及装置制造方法及图纸

技术编号:21092315 阅读:65 留言:0更新日期:2019-05-11 10:58
本申请公开了一种目标跟踪方法及装置。该方法包括在视频帧的图像目标候选区中提取图像特征,并输出初始响应值;平滑所述视频帧的初始响应值;以及更新响应值,确定目标在视频帧中的位置信息。本申请解决了目标跟踪方法的效果不佳的技术问题。通过本申请的方法,对于网络的输出响应会经常因为尺度变换、突然运动等复杂的目标状态而出现多峰、漂移等现象,通过充分考虑了图像相邻超像素块之间的相似性关系,利用该关系约束了初始响应值,抑制了跟踪过程中的漂移现象,进而校正目标的位置信息。进而提升了标跟踪方法的跟踪精度和跟踪效率。

【技术实现步骤摘要】
目标跟踪方法及装置
本申请涉及计算机视觉领域,具体而言,涉及一种目标跟踪方法及装置。
技术介绍
目标跟踪是计算机视觉领域研究的热点之一,当前广泛应用于视频监控、人机交互等实际问题中,具有重要的研究价值。但是受限于实际环境的复杂性,例如遮挡、光照变化、目标形变以及背景相似干扰等,当相关滤波的跟踪方法在准确性、鲁棒性以及实时性上可以在一定程度的满足实际应用需求。专利技术人发现,在相关滤波的跟踪方法,跟踪过程中会产生漂移现象,进一步影响到跟踪准确性。针对相关技术中目标跟踪方法的效果不佳的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种目标跟踪方法及装置,以解决目标跟踪方法的效果不佳的问题。为了实现上述目的,根据本申请的一个方面,提供了一种目标跟踪方法。根据本申请的目标跟踪方法包括:在视频帧的图像目标候选区中提取图像特征,并输出初始响应值;平滑所述视频帧的初始响应值;以及更新响应值,确定目标在视频帧中的位置信息。进一步地,在视频帧的图像目标候选区中提取图像特征,并输出初始响应值包括:训练轻量级网络模型对图像目标候选区进行特征提取;根据特征提取结果得到滤波器;以及通过滤波器输出初始响应值。进一步地,平滑所述视频帧的初始响应值包括:通过网络提取目标候选区域的图像块;对图像块超像素化处理,得到相邻超像素块之间的相似性关系;根据所述相似性关系构建相似度矩阵,并通过所述相似矩阵平滑初始响应值。进一步地,更新响应值,确定目标在视频帧中的位置信息包括:根据所述初始响应值和相似度矩阵更新响应图,确认目标位置。进一步地,更新响应值,确定目标在视频帧中的位置信息包括:通过训练卷积神经网络得到图像目标候选区的响应值;校正目标的位置信息,得到校正后的响应值;根据所述校正后的响应值确定视频帧中的位置信息。为了实现上述目的,根据本申请的另一方面,提供了一种目标跟踪装置。根据本申请的目标跟踪装置包括:响应模块,用于在视频帧的图像目标候选区中提取图像特征,并输出初始响应值;平滑模块,用于平滑所述视频帧的初始响应值;以及学习更新模块,用于更新响应值,确定目标在视频帧中的位置信息。进一步地,所述响应模块包括:提取单元,用于训练轻量级网络模型对图像目标候选区进行特征提取;滤波单元,用于根据特征提取结果得到滤波器;以及输出单元,用于通过滤波器输出初始响应值。进一步地,所述平滑模块包括:图像块单元,用于通过网络提取目标候选区域的图像块;相似性关系单元,用于对图像块超像素化处理,得到相邻超像素块之间的相似性关系;平滑单元,用于根据所述相似性关系构建相似度矩阵,并通过所述相似矩阵平滑初始响应值。进一步地,所述平滑模块包括:更新单元,用于根据所述初始响应值和相似度矩阵更新响应图,确认目标位置。进一步地,所述学习更新模块包括:响应单元,用于通过训练卷积神经网络得到图像目标候选区的响应值;校正单元,用于校正目标的位置信息,得到校正后的响应值;确定单元,用于根据所述校正后的响应值确定视频帧中的位置信息。在本申请实施例中,采用在视频帧的图像目标候选区中提取图像特征,并输出初始响应值的方式,通过平滑所述视频帧的初始响应值,达到了更新响应值,确定目标在视频帧中的位置信息的目的,从而实现了抑制了跟踪过程中的漂移现象的技术效果,进而解决了目标跟踪方法的效果不佳的技术问题。本申请通过将连续CRF模型运用到目标跟踪中,通过对CRF模型中单个势结点和相邻势结点之间的关系建模,优化了基于深度学习的DCF跟踪算法,有效缓解了不同情况下的跟踪漂移问题,特别是在目标尺度变化时,明显提高了跟踪的成功率。此外,本申请在OTB-2013的五十个视频序列和OTB-2015的一百个视频序列上进行了大量的实验与测试,在统一环境下,使用通用评测标准,与九种近年来在国际上具有代表性的相关算法进行了对比分析,显著性实验结果验证了算法的有效性,准确性和鲁棒性。附图说明构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请第一实施例的目标跟踪方法示意图;图2是根据本申请第二实施例的目标跟踪方法示意图;图3是根据本申请第三实施例的目标跟踪方法示意图;图4是根据本申请第四实施例的目标跟踪方法示意图;图5是根据本申请第一实施例的目标跟踪装置示意图;图6是根据本申请第二实施例的目标跟踪装置示意图;图7是根据本申请第三实施例的目标跟踪装置示意图;图8是根据本申请第四实施例的目标跟踪装置示意图;图9是根据本申请实施例的目标跟踪模型架构示意图;图10是根据本申请实施例的图像超像化过程示意图;图11是根据本申请实施例的深度网络模块中网络设计细节示意图;图12是根据本申请实施例的滤波器随着时间步长迭代更新的示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。在本申请中结合连续条件随机场CRF模型提出了一种新的端到端的目标跟踪方法,充分考虑了图像相邻超像素块之间的相似性关系,利用该关系约束了初始响应值,抑制了跟踪过程中的漂移现象。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。如图1所示,该方法包本文档来自技高网
...

【技术保护点】
1.一种目标跟踪方法,其特征在于,包括:在视频帧的图像目标候选区中提取图像特征,并输出初始响应值;平滑所述视频帧的初始响应值;以及更新响应值,确定目标在视频帧中的位置信息。

【技术特征摘要】
1.一种目标跟踪方法,其特征在于,包括:在视频帧的图像目标候选区中提取图像特征,并输出初始响应值;平滑所述视频帧的初始响应值;以及更新响应值,确定目标在视频帧中的位置信息。2.根据权利要求1所述的目标跟踪方法,其特征在于,在视频帧的图像目标候选区中提取图像特征,并输出初始响应值包括:训练轻量级网络模型对图像目标候选区进行特征提取;根据特征提取结果得到滤波器;以及通过滤波器输出初始响应值。3.根据权利要求1所述的目标跟踪方法,其特征在于,平滑所述视频帧的初始响应值包括:通过网络提取目标候选区域的图像块;对图像块超像素化处理,得到相邻超像素块之间的相似性关系;根据所述相似性关系构建相似度矩阵,并通过所述相似矩阵平滑初始响应值。4.根据权利要求3所述的目标跟踪方法,其特征在于,更新响应值,确定目标在视频帧中的位置信息包括:根据所述初始响应值和相似度矩阵更新响应图,确认目标位置。5.根据权利要求1所述的目标跟踪方法,其特征在于,更新响应值,确定目标在视频帧中的位置信息包括:通过训练卷积神经网络得到图像目标候选区的响应值;校正目标的位置信息,得到校正后的响应值;根据所述校正后的响应值确定视频帧中的位置信息。6.一种目标跟踪装置,其特征在于,包括:响...

【专利技术属性】
技术研发人员:刘彬张默
申请(专利权)人:北京陌上花科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1