【技术实现步骤摘要】
一种基于孪生网络和残差结构的目标跟踪方法
[0001]本专利技术涉及一种基于孪生网络和残差结构的目标跟踪方法,属于计算机视觉领域。
技术介绍
[0002]目标跟踪是计算机视觉领域重要的研究方向,在很多实际应用中具有至关重要的地位,利用目标跟踪技术可以对视频序列中运动目标进行识别和跟踪。
[0003]目标跟踪算法早期使用光流法、mean
‑
shif算法、CamShift算法等,但是这类算法的精度和速度逐渐无法满足人们的需求。受到信号处理的启发,相关滤波被应用到计算机视觉领域。研究者首次将相关滤波器的思想应用在目标跟踪领域,提出了最小输出误差平方和算法,通过快速傅里叶变换将时域中复杂的运算转化为频域中的点乘运算来进行滤波器模板的求解,因此可以快速地跟踪到目标,但是其对灰度特征的表征能力限制了其性能。随后研究者在MOSSE算法的基础上提出了KCF算法,利用循环矩阵采集正负样本,使用核函数提高分类器性能,并引入了HOG特征,极大地提高了跟踪器的性能。还有研究者从相关滤波响应图入手,对响应图进行多峰目标检测并 ...
【技术保护点】
【技术特征摘要】
1.一种基于孪生网络和残差结构的目标跟踪方法,其特征在于,包括以下步骤:(1)分别输入作为跟踪目标的模板图像,和作为搜索范围的检测图像;(2)利用引入非对称残差注意力模块及自适应权值更新的SiameseRPN网络模型,分别提取获得目标的位置和外形;(3)将获得的目标位置信息和外形信息融合,得到最终的跟踪结果。2.根据权利要求1所述的一种基于孪生网络和残差结构的目标跟踪方法,其特征在于,建立骨干网络进行特征提取,网络结构如下:使用Pytorch框架搭建骨干网络,结构如下:两幅127*127*3和255*255*3的图像分别作为模板图像和检测图像输入至网络,经过5层残差块,第一层残差块卷积核大小为7*7*64,步长为2;第二层卷积核为1*1*64、3*3*64、1*1*256、1*1*256,步长为1;第三层卷积核为1*1*128、3*3*128、1*1*512、3*3*512,步长为2;第四层为1*1*256、3*3*256、1*1*1024、3*3*1024,步长为1;第五层为1*1*512、3*3*512、1*1*2048、3*3*2048,步长为1;每一层卷积都含有批标准化、relu激活函数;将最后三层的输出送入SiameseRPN网络中。3.根据权利要求1所述的一种基于孪生网络和残差结构的目标跟踪方法,其特征在于,所述步骤(2)中SiameseRPN网络引入了非对称残差注意力模块;非对称残差注意力模块中,每一个残差块由数个卷积核大小为3
×
3、1
×
3以及3
×
1的并行层组成,每一层都进行批处理归一化处理;非对称残差注意力模块包含两个下采样和两个上采样;注意力网络结构由多层注意力模块堆叠而成,注意力模块包含主干分支和掩膜分支,采用残差学习的方式,将得到的注意力特征图与主干特征图进行element
‑
wised add,输出为:H
i,c
(x)=(1+M
i,c
(x))*F
i,c
(x)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中,x为输...
【专利技术属性】
技术研发人员:陈洪刚,崔珂璠,熊淑华,何小海,吴晓红,王正勇,滕奇志,
申请(专利权)人:四川大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。