The invention requests to protect an object tracking algorithm combining residual attention network and context information. The algorithm first passes the first frame of the tracking video sequence into the convolution layer to obtain 256 feature maps, and then passes the feature map of the first frame to the residual attention network to obtain the residual feature map. Then the residual response map is obtained by combining the residual feature map with the convolution layer feature map. At the same time, the last frame and the current frame are simultaneously transmitted to the convolution network layer to extract the feature map, and then the residual response map of the first frame, the feature map of the previous frame and the current frame are simultaneously transmitted to three full-connection layers to predict the location of the tracking target in the current frame. Finally, multi-output layer is used to output the coordinate positions of the upper left and lower right corner of the tracking target in the current frame. The invention improves the accuracy and robustness of the tracking algorithm in complex situations such as target occlusion.
【技术实现步骤摘要】
一种结合残差注意力和上下文信息的目标跟踪算法
本专利技术属于图像处理
,特别涉及基于卷积神经网络的残差注意力机制和融合上下文信息的目标跟踪方法以及两种方法的结合。
技术介绍
目标跟踪算法是计算机视觉领域里面的一个重要的方向有着广泛的应用。越来越多的学者都致力于目标跟踪算法的研究。目标跟踪算法主要分为以下两种:传统的目标跟踪算法、基于卷积神经网络的跟踪算法。传统的目标跟踪算法主要分为产生式模型和判别式模型。生成式模型是将跟踪问题看做搜索与跟踪目标最相近的图像区域,主要包括采用稀疏表示模型、密度估计模型、增量子空间模型等等。判别式模型主要是利用在线学习或者离线训练检测器来区分背景和目标,找出目标所在的位置。这些跟踪算法通常基于多实例学习、P-N学习、结构化支持向量机(supportvectormachineSVM)等分类器。传统算法中由于相关滤波器在计算效率的优异性能,使其在目标跟踪领域备受关注。其中一种具有平均误差的滤波器跟踪速度可以达到每秒百帧。同时一种基于相关滤波的CSK跟踪算法,解决了密集采样问题,并利用了傅里叶变换快速实现了检测过程完成了跟踪。基于卷积神经网络的目标跟踪算法主要分为三大类:基于分类的卷积神经网络目标跟踪、基于回归的卷积神经网络目标跟踪、基于相似度匹配的卷积神经网络目标跟踪。基于分类的卷积神经网络目标跟踪充分的利用了卷积神经网络特征提取和分类的强大能力,通过离线训练和再现微调的方法利用大量的数据离线训练网络,使网络获得通用特征表达能力,再利用第一帧目标周围的正负样本的信息在线微调,大大减少了对于样本的需求,基于回归的卷积神经网络目 ...
【技术保护点】
1.一种结合残差注意力和上下文信息的目标跟踪算法,其特征在于,包括以下步骤:S1、将已经标注好的第一帧跟踪目标区域,上一帧已经预测的跟踪目标区域和当前帧的搜索区域同时传到卷积层,得到第一帧的卷积特征图、上一帧的卷积特征图及当前帧的卷积特征图;S2、将第一帧的卷积特征图送到残差注意力网络经过五层卷积操作得到残差特征图;S3、将第一帧的卷积特征图和残差特征图进行乘积操作得到残差响应特征图;S4、将第一帧的残差特征响应图、上一帧和当前帧的卷积特征图传到全连接层,通过全连接层将卷积层二维的特征图转成一维的向量,通过全连接层来学习第一帧,上一帧和当前帧三者之间的时空关系;S5、将全连接层的结果输出到输出层得到最后的跟踪结果。
【技术特征摘要】
1.一种结合残差注意力和上下文信息的目标跟踪算法,其特征在于,包括以下步骤:S1、将已经标注好的第一帧跟踪目标区域,上一帧已经预测的跟踪目标区域和当前帧的搜索区域同时传到卷积层,得到第一帧的卷积特征图、上一帧的卷积特征图及当前帧的卷积特征图;S2、将第一帧的卷积特征图送到残差注意力网络经过五层卷积操作得到残差特征图;S3、将第一帧的卷积特征图和残差特征图进行乘积操作得到残差响应特征图;S4、将第一帧的残差特征响应图、上一帧和当前帧的卷积特征图传到全连接层,通过全连接层将卷积层二维的特征图转成一维的向量,通过全连接层来学习第一帧,上一帧和当前帧三者之间的时空关系;S5、将全连接层的结果输出到输出层得到最后的跟踪结果。2.根据权利要求1所述的一种结合残差注意力和上下文信息的目标跟踪算法,其特征在于,所述步骤S1的卷积层是使用的CaffeNet深度学习网络的前五层卷积层,使用CaffNet在Imagenet图片数据集分类训练的参数模型来初始化网络参数。3.根据权利要求1或2所述的一种结合残差注意力...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。