一种基于级联的上下文感知框架的目标跟踪方法技术

技术编号：22818223 阅读：17 留言：0更新日期：2019-12-14 13:33

本发明专利技术公开了一种基于级联的上下文感知框架的目标跟踪方法，所述方法提出了一个基于两个网络的级联的上下文感知框架，其包括两个子网络：一个基于图像的上下文感知网络ICANet和一个基于图像块的上下文感知网络PCANet。该框架渐近地建模了各种目标与其上下文信息之间的各种变化。第一个网络关注的是目标与其上下文之间最具判别力的信息以及目标粗略的结构，第二个网络关注的是目标自身的细致的结构信息。根据这两个网络的输出—最终的上下文感知图，可以灵活地生成目标的定位框，有效地区分目标与其周围干扰物等背景信息。本发明专利技术所获得的FCA map能够灵活地嵌入到多种跟踪框架中。

A target tracking method based on cascaded context aware framework

全部详细技术资料下载

【技术实现步骤摘要】
一种基于级联的上下文感知框架的目标跟踪方法
本专利技术涉及一种目标跟踪方法，具体涉及一种基于级联的上下文感知框架的目标跟踪方法。
技术介绍
基于卷积神经网络(CNNs)的强大的表示能力，研究者们提出了大量的基于卷积神经网络的跟踪器。其中，大多数跟踪器使用矩形框来标记目标的位置。在这种情况下，目标模型将或多或少的包含上下文信息。而且，忽略上下文信息可能对跟踪性能造成很大的影响。首先，从有限的空间区域学习目标模型可能会导致过度拟合，且对于目标外观的快速变化并不鲁棒。其次，缺乏真正意义上的负样本将大大削弱跟踪器对于复杂背景的鲁棒性，特别是当目标与其上下文环境中存在相似的视觉信息时将大大增加跟踪漂移现象出现的风险。第三，当上下文信息没有充分考虑时，跟踪器难以有效处理目标遭遇遮挡的情况。现有的目标跟踪算法大多只针对目标局部范围内的上下文信息，对于整幅输入图像的上下文信息很少关注，使得存在于整幅图像范围内的干扰物和背景信息被忽略，从而影响了跟踪算法的鲁棒性。
技术实现思路
为了减少背景对跟踪器的干扰，关注整个图像每个角落的上下文信息，同时解决现有目标跟踪算法存在的上述问题，本专利技术提供了一种基于级联的上下文感知框架的目标跟踪方法。本专利技术的目的是通过以下技术方案实现的：一种基于级联的上下文感知框架的目标跟踪方法，包括如下步骤：步骤一、构建基于级联的上下文感知框架(CAT)，所述上下文感知框架包括两个子网络：一个基于图像的上下文感知网络(ICANet)和一个基于图像块的上下文...

【技术保护点】
1.一种基于级联的上下文感知框架的目标跟踪方法，其特征在于所述方法包括如下步骤：/n步骤一、构建基于级联的上下文感知框架CAT，所述CAT包括两个子网络：一个基于图像的上下文感知网络ICANet和一个基于图像块的上下文感知网络PCANet，其中：ICANet的输入为整幅图像，用以捕获整幅输入图像范围内的背景信息，PCANet用以区分目标局部范围内的相似干扰物；/n步骤二、通过ICANet学习图像级的上下文感知图ICA map，捕捉目标与周围上下文之间最具判别力的特征以及目标的大概结构信息；/n步骤三、通过PCANet学习图像块级的上下文感知图PCA map，基于该PCAmap获得目标的自身结构信息并抑制干扰物的信息；/n步骤四、在获得ICA map和PCA map之后，将PCA map的像素映射到ICA map以此来得到最终的上下文感知图FCA map；/n步骤五、基于最终的FCA map获得目标的定位框。/n

【技术特征摘要】
1.一种基于级联的上下文感知框架的目标跟踪方法，其特征在于所述方法包括如下步骤：
步骤一、构建基于级联的上下文感知框架CAT，所述CAT包括两个子网络：一个基于图像的上下文感知网络ICANet和一个基于图像块的上下文感知网络PCANet，其中：ICANet的输入为整幅图像，用以捕获整幅输入图像范围内的背景信息，PCANet用以区分目标局部范围内的相似干扰物；
步骤二、通过ICANet学习图像级的上下文感知图ICAmap，捕捉目标与周围上下文之间最具判别力的特征以及目标的大概结构信息；
步骤三、通过PCANet学习图像块级的上下文感知图PCAmap，基于该PCAmap获得目标的自身结构信息并抑制干扰物的信息；
步骤四、在获得ICAmap和PCAmap之后，将PCAmap的像素映射到ICAmap以此来得到最终的上下文感知图FCAmap；
步骤五、基于最终的FCAmap获得目标的定位框。

2.根据权利要求1所述的基于级联的上下文感知框架的目标跟踪方法，其特征在于所述步骤一中，ICANet由一个特征提取器和五个附加模块组成，其中：特征提取器包括VGG-M中的五个卷积层，每个附加模块由卷积层、平均池化层、卷积LSTM单元和反卷积层组成。

3.根据权利要求2所述的基于级联的上下文感知框架的目标跟踪方法，其特征在于所述平均池化层的核大小为3×3。

4.根据权利要求2所述的基于级联的上下文感知框架的目标跟踪方法，其特征在于所述卷积LSTM单元由输入门It、遗忘门Ft、细胞状态Ct和输出门Ot组成，在时间维度上，门和状态之间的关系表示为：

其中，Xt是对比层生成的特征，Ct...

【专利技术属性】
技术研发人员：邬向前，卜巍，马丁，
申请(专利权)人：哈尔滨工业大学，
类型：发明
国别省市：黑龙;23

全部详细技术资料下载我是这个专利的主人