【技术实现步骤摘要】
基于注意力和关系检测的孪生网络目标跟踪方法及系统
[0001]本专利技术涉及计算机视觉
,特别是涉及基于注意力和关系检测的孪生网络目标跟踪方法及系统。
技术介绍
[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
,并不必然构成现有技术。
[0003]随着孪生网络引入到目标跟踪领域,基于孪生网络的跟踪器在单目标跟踪方面不断地取得了优异的成绩。由于兼顾了准确率和速度成为主流的方法之一,但依旧存在着很多问题。
[0004]首先,目标跟踪结果受多种因素的影响,如光照变化、视频模糊、遮挡、目标快速移动、尺度变化、出视野等等。这些都让目标跟踪变得非常困难,容易导致目标不能被准确的识别,造成跟踪失败,并对后续任务会造成极大的困难。然而注意力机制可以在某种程度上应对这些挑战。最常用的注意力机制主要分为两种:通道注意力和空间注意力,这两种机制都通过用不同的聚集策略、转换和增强功能聚集来自所有位置的相同特征来增强原始特征。但大多数基于注意力机制的目标跟踪算法依赖于单一注意力机制,没有很好的将通道注意力和空间注意力完美的结合起来。
[0005]其次,基于孪生网络的目标跟踪器的分类和回归通常是独立优化的,会导致他们之间会存在不匹配的问题。具体来说,分类置信度最高的位置对应的框并不一定是最准确的,甚至可能是错误。
技术实现思路
[0006]为了解决现有技术的不足,本专利技术提供了基于注意力和关系检测的孪生网络目标跟踪方法及系统;
[0007]第一方面,本专利技术提供了基于注意力 ...
【技术保护点】
【技术特征摘要】
1.基于注意力和关系检测的孪生网络目标跟踪方法,其特征是,包括:获取视频序列,将第一帧作为模板图像,当前帧作为搜索图像;在模板分支中,将模板图像输入到ResNet
‑
50骨干网络中,进行特征提取;采用注意力模块对最后三层提取的特征分别进行特征增强处理,得到三个模板注意力特征;在搜索分支中,根据前一帧的跟踪结果裁剪出搜索图像,将搜索图像输入到ResNet
‑
50骨干网络中,进行特征提取;采用注意力模块对最后三层提取的特征分别进行特征增强处理,得到三个搜索注意力特征;将三个模板注意力特征和三个搜索注意力特征,分别对应输入到目标跟踪模块Siamese RPN中得到三个分类结果和三个回归结果;将三个分类结果和三个回归结果分别进行加权融合,得到融合后的分类结果和融合后的回归结果;基于融合后的回归结果,输入到关系检测器中以度量回归结果中目标和预测图像的关系,得到回归分支的分数图;将回归分支的分数图与分类分支的分数图进行点乘,以过滤掉背景中的干扰;将过滤掉干扰的分数图经过卷积操作,得到最后的分类得分,并获取最大响应位置对应的预测框。2.如权利要求1所述的基于注意力和关系检测的孪生网络目标跟踪方法,其特征是,所述采用注意力模块对最后三层提取的特征分别进行特征增强处理,得到三个模板注意力特征;具体是指:对ResNet
‑
50网络中的covn3_x层、covn4_x层、covn5_x层提取的特征f3(z)、f4(z)、f5(z)用注意力模块进行特征增强,生成模板注意力特征f3(z
’
)、f4(z
’
)、f5(z
’
)。3.如权利要求1所述的基于注意力和关系检测的孪生网络目标跟踪方法,其特征是,所述采用注意力模块对最后三层提取的特征分别进行特征增强处理,得到三个搜索注意力特征;具体包括:对ResNet
‑
50网络中的covn3_x层、covn4_x层、covn5_x层提取的特征f3(x)、f4(x)、f5(x)用注意力模块进行特征增强,生成搜索注意力特征f3(x
‘
)、f4(x
‘
)、f5(x
‘
)。4.如权利要求1所述的基于注意力和关系检测的孪生网络目标跟踪方法,其特征是,所述注意力模块,工作原理:将从ResNet
‑
50骨干网络中提取的的特征图分成多个组,采用通道分离,分成两个分支并行处理各组的子特征;对于通道注意力分支,使用全局平局池化生成通道统计量,用一对参数来缩放和移动通道向量;对于空间注意力分支,使用group norm生成空间统计量,用类似于通道注意力分支生成相关特征;然后将两个分支结合起来;随后将所有子特征聚集;使用通道混合实现不同子特征之间的通信;最后输出注意力特征。5.如权利要求4所述的基于注意力和关系检测的孪生网络目标跟踪方法,其特征是,对于通道注意力分支,首先,利用全局平局池化来嵌入全局信息,从而生成通道统计量s∈R
C/2G
×1×1,其中统计量可以通过通道维度H
×
W来收缩X
k1
计算:
然后,获得通道注意力的最终输出:X
′
k1
=σ(F
c
(s))
·
X
k1
=σ(W1s+b1)
·
X
k1
其中,σ(
·
)=sigmoid(
·
),F
c
(x)=W
x
+b,X
k
∈R
C/2G
×1×1,b1∈R
C/2G
×1×1是用来缩放和位移s的参数;对于空间注意力分支,首先,使用Group Norm来获取空间统计信息X
k2
,然后采用F
c
(
·
)来增强的表示,最终空间注意力的输出通过以下方式:X
′
k2
=σ(W2·
GN+b2)
·
X
k2
;其中,W2,b2∈R
C/2G
×1×1;最后,将两个分支链接起来,使通道数和输入数相同:X
′
k1
=[X
′
k1
...
【专利技术属性】
技术研发人员:李爱民,刘笑含,刘腾,李稼川,刘德琦,
申请(专利权)人:齐鲁工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。