【技术实现步骤摘要】
基于收缩增强损失函数的多视图置信度感知跟踪方法
[0001]本专利技术涉及目标跟踪
,特别是指一种基于收缩增强损失函数的多视图置信度感知孪生跟踪方法。
技术介绍
[0002]视觉跟踪是计算机视觉领域的一个重要研究分支,由于其在视频监控和人机交互等领域的广泛应用,在过去的几十年里取得了巨大的进展。其目的是在初始帧上提供要跟踪的目标,然后在后续帧中自动定位该目标。尽管视觉跟踪技术已经取得了很大的进展,但面对实际跟踪过程中存在的遮挡、背景杂乱等挑战,如何实现较为鲁棒的跟踪仍是一个亟待解决的问题。
[0003]近年来,孪生跟踪器因其能更好地平衡跟踪精度和速度,而受到了研究者的广泛关注。然而,它们都只使用第一帧作为模板来获取特征,这使得在面对一些复杂的跟踪场景时很难区分目标和背景。为了解决这一问题,一些算法开始关注如何利用已知的目标信息进一步挖掘目标特征,因此基于目标感知的跟踪算法开始出现。它们或通过保留目标的详细附加信息,进一步挖掘目标特性;或通过损失函数挑选对目标更敏感的通道特征;或通过注意力机制,使搜索区域的每个部 ...
【技术保护点】
【技术特征摘要】
1.一种基于收缩增强损失函数的多视图置信度感知跟踪方法,其特征在于,包括以下步骤:步骤一、根据初始帧图像中的目标位置信息分离出前景图像,并利用平均像素值遮挡目标位置,得到背景图像;步骤二、利用预训练的VGG16特征提取网络,分别提取模板图像、前景图像和背景图像的特征,分别得到各特征图的conv4
‑
1和conv4
‑
3两层特征;步骤三、利用收缩增强损失函数进行指导,挑选模板特征中对目标更敏感的通道,去除冗余通道;步骤四、前景特征和背景特征根据步骤三确定的通道位置进行通道的裁剪;步骤五、读取下一帧,并根据上一帧的目标位置确定搜索区域,根据步骤二的过程提取搜索区域特征,根据步骤三确定的通道位置进行通道的裁剪;步骤六、裁剪后的搜索区域特征分别与第一帧裁剪后的模板、前景、背景特征做互相关操作,分别得到模板响应图、前景响应图和背景响应图,将模板响应图与前景响应图加权得到更能突出目标的响应图;步骤七、根据背景响应图的最大响应值确定是否引入背景信息来抑制干扰,若背景最大响应值超过设定的阈值,则减去背景响应图,若不超过,步骤六得到的响应图即为最终响应图,同时返回步骤五,直至视频结束。2.根据权利要求1所述的基于收缩增强损失函数的多视图置信度感知跟踪方法,其特征在于:步骤二中网络的权值学习形式如下:其中,*表示卷积运算,W表示卷积层的核权值,X表示输入特征,Y是被标记的目标初始位置,λ表示正则化参数。3.根据权利要求1所述的基于收缩增强损失函数的多视图置信度感知跟踪方法,其特征在于:步骤三中损失函数L
S
具体表示如下:m和n...
【专利技术属性】
技术研发人员:赵彦春,张焕龙,马宗浩,付伟强,王攀云,王勇,沈冯立,
申请(专利权)人:电子科技大学长三角研究院湖州,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。