一种基于时空注意力机制的孪生网络跟踪系统及方法技术方案

技术编号：34043360 阅读：65 留言：0更新日期：2022-07-06 14:01

本发明专利技术公开了计算机视觉的目标跟踪技术领域的一种基于时空注意力机制的孪生网络跟踪系统及方法，包括：获取图像数据中的模板图像数据和搜索图像数据；将模板图像数据和搜索图像数据分别输入到模板分支与搜索分支中进行特征提取，得到模板特征数据与搜索特征数据；将搜索特征数据输入到时空注意力机制模块中，得到时空注意力信息特征；将模板特征数据与时空注意力信息特征互相关得到响应图；将响应图输入分类回归网络中进行逐像素的分类与回归，对每个像素点进行分类，计算像素点到预测框的距离，得到分类结果与边界框。本发明专利技术能够更够准确的跟踪目标，有效解决模型对于时空上下文信息难以建立关联、目标分类与边界框回归较为复杂等问题。归较为复杂等问题。归较为复杂等问题。

A twin network tracking system and method based on spatiotemporal attention mechanism

全部详细技术资料下载

【技术实现步骤摘要】
一种基于时空注意力机制的孪生网络跟踪系统及方法

[0001]本专利技术涉及一种基于时空注意力机制的孪生网络跟踪系统及方法，属于计算机视觉的目标跟踪

技术介绍

[0002]目标跟踪广泛应用在视频分析、智能交通、虚拟现实等领域，其核心任务是给定目标在视频第一帧初始位置后，自动估计后续帧中目标的位置。但跟踪过程中容易受到遮挡、模糊、形变、光照变化等一系列复杂因素的干扰，因此，设计一个可以在现实复杂场景下稳定高效运行的跟踪方法是十分具有研究与实用价值的。
[0003]目前，现有的跟踪算法大致可以分为两大类。一类将相关滤波的思想应用到跟踪领域，提出了误差最小平方和滤波器目标跟踪算法：将跟踪器模板的求解由时域复杂运算转换为傅里叶域点乘计算，计算量大大减少，跟踪器速度得到飞跃性提升。虽然这种算法在速度上很快，但是精度并不理想。另一类，为了取得精度与速度之间的平衡，基于深度学习的孪生网络跟踪算法逐渐流行。孪生网络主要由特征提取过程中共享参数的模板分支与搜索分支组成。利用相似性学习的方法，提出了全卷积孪生网络跟踪算法，通过计算目标模板与搜索区域深度特征之间的相似值，将跟踪问题转化为相似匹配问题。该算法可以使用大量数据进行端到端的离线训练，既可以获得较高的精度，也无需在线调整。通过在全卷积孪生网络目标跟踪算法中引入检测领域的区域建议网络，使用区分前景与背景、回归边界框的方法，实现了对目标尺度的灵活应对，同时得到了更为精确的边界框。实验结果表明，这种组合模型的跟踪效果要明显优于相关滤波算法和全卷积孪生网络算法。
...

【技术保护点】

【技术特征摘要】
1.一种基于时空注意力机制的孪生网络跟踪方法，其特征是，包括：获取图像数据中的模板图像数据和搜索图像数据；将模板图像数据和搜索图像数据分别输入到模板分支与搜索分支中进行特征提取，得到模板特征数据与搜索特征数据；将搜索特征数据输入到时空注意力机制模块中，得到时空注意力信息特征；将模板特征数据与时空注意力信息特征互相关得到响应图；将响应图输入分类回归网络中进行逐像素的分类与回归，对每个像素点进行分类，计算像素点到预测框的距离，得到分类结果与边界框。2.根据权利要求1所述的基于时空注意力机制的孪生网络跟踪方法，其特征是，获取图像数据中的模板图像数据和搜索图像数据，包括：将数据集或摄像头捕捉画面的第一帧图像以目标为中心裁剪出指定像素大小的图像作为模板图像数据，在跟踪过程中第i+1帧以第i帧目标位置为中心裁剪出设定大小的图像作为搜索图像数据。3.根据权利要求1所述的基于时空注意力机制的孪生网络跟踪方法，其特征是，所述特征提取公式为：其中，I是输入图像矩阵，I((x
a
,y
a
),(x
b
,y
b
))为I的子矩阵，(x
a
,y
a
)和(x
b
,y
b
)为子矩阵的左上角与右下角的直角坐标系的坐标，k为提取特征数据的步长，f(
·
)为特征提取函数。4.根据权利要求1所述的基于时空注意力机制的孪生网络跟踪方法，其特征是，所述时空注意力信息特征为：其中，o
i
为时空注意力信息特征，为空间注意力信息特征，为时间注意力信息特征，z
i
为输入特征；所述空间注意力信息特征为：所述空间注意力信息特征为：所述空间注意力信息特征为：所述空间注意力信息特征为：所述空间注意力信息特征为：所述空间注意力信息特征为：所述空间注意力信息特征为：其中，为空间特征，C(Z
s
)为归一化因子，f为高斯函数，和分别是位置i和位置j的特征，g为一元函数，是可学习参数，和均为空间特征权重。5.根据权利要求1所述的基于时空注意力机制的孪生网络跟踪方法，其特征是，所述响
应图为：其中，为响应图，为卷积特征提取函数，*为卷积互相关运算，TS(
·
)为实际注意力模块，b1为响应图每个位置的偏置值，x为搜索特征数据，z为模板特征数据。6.根据权利要求1所述的基于时空注意力机制的孪生网络跟踪方法，其特征是，将响应图输入分类回归网络中进行逐像素的分类与回归，对每个像素点进行分类，计算像素点到预测框的距离，得到分类结果与边界框，包括：将响应图进行升维到所述分类回归网络中的分类分支对于上每一个像素点预测类别得到分类图其中，分类图A
cls
每一个(i,j,:)包含了一个代表了搜索区域前景与背景的置信度的2D向量；所述分类回归网络中的回归分支计算上每一个像素点到边界框的距离得到回归图其中，回归图A
reg
上每一...

【专利技术属性】
技术研发人员：卢先领，刘如浩，
申请(专利权)人：江南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人