基于旋转等变网络与三重注意力机制目标跟踪方法与系统技术方案

技术编号:41466270 阅读:24 留言:0更新日期:2024-05-30 14:21
本发明专利技术提出一种基于旋转等变网络与三重注意力机制目标跟踪方法与系统,该方法在特征提取过程中通过三重注意力机制模块通过捕获三个分支之间的跨维相互作用信息,在进行多头自注意力计算,以增强给定的目标图像和搜索区域目标图像的全局上下文相关信息,再将所得特征图,通过旋转等变网络对进行旋转操作和剩余转换构建维间依赖关系,得到具有完全旋转不变性的特征图,再利用具有完全旋转不变性的特征图进行后续分类回归操作。本发明专利技术可提高目标图像和搜索区域目标图像的全局匹配的准确性,实现更准确的跟踪。

【技术实现步骤摘要】

本专利技术涉及计算机视觉与图像处理,特别涉及一种基于旋转等变网络与三重注意力机制目标跟踪方法与系统


技术介绍

1、一般来说,由于外观变化、变形、快速运动以及遮挡等诸多原因,视觉跟踪仍然是一项具有挑战性的任务。近年来,基于卷积神经网络(cnn)的孪生网络跟踪器被广泛应用于视觉跟踪领域。具体的,将基于cnn模型的特征信息引入到模板和搜索分支中,通过互关操作得到的一个或多个响应图用于解码提取的特征信息。其中,典型的cnn模型包括alexnet、vgg和resnet等。目前,大多数cnn模型主要使用多个卷积算子(如3×3或5×5),可以有效地捕捉空间局部信息,从而建模图像内容的全局关系。

2、首先,孪生跟踪器只利用目标的外观,完全忽略了背景外观信息,这对于区分场景中的目标和类似物体非常重要。其次,对于未包含在离线训练集中的对象,学习到的相似度度量不一定可靠,泛化能力较差。第三,暹罗网络没有提供强大的更新策略。并且,部分视觉跟踪算法由于忽略了在连续帧时间维度中生成的上下文相关信息,导致丢失了大量的前景信息,且产生了冗余的背景信息,进而导致很难处理复杂外本文档来自技高网...

【技术保护点】

1.一种基于旋转等变网络与三重注意力机制目标跟踪方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的基于旋转等变网络与三重注意力机制目标跟踪方法,其特征在于,在所述步骤2中,三重注意力机制模块采基于多头自注意力,每个注意力头采用三分支结构,每个分支分别将包含局部语义信息的特征图调整为不同维度,再通过聚合的方式捕获三个分支之间的跨维相互作用信息,得到精细特征图的方法具体包括如下步骤:

3.根据权利要求2所述的基于旋转等变网络与三重注意力机制目标跟踪方法,其特征在于,在所述步骤2中,将精细特征图进行自注意力计算,获取注意力输出,再将每个注意力头的输出进行...

【技术特征摘要】

1.一种基于旋转等变网络与三重注意力机制目标跟踪方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的基于旋转等变网络与三重注意力机制目标跟踪方法,其特征在于,在所述步骤2中,三重注意力机制模块采基于多头自注意力,每个注意力头采用三分支结构,每个分支分别将包含局部语义信息的特征图调整为不同维度,再通过聚合的方式捕获三个分支之间的跨维相互作用信息,得到精细特征图的方法具体包括如下步骤:

3.根据权利要求2所述的基于旋转等变网络与三重注意力机制目标跟踪方法,其特征在于,在所述步骤2中,将精细特征图进行自注意力计算,获取注意力输出,再将每个注意力头的输出进行聚合,以捕获全局上下文相关性,得到包含全局上下文相关信息的特征图的方法具体包括如下步骤:

4.根据权利要求2所述的基于旋转等变网络与三重注意力机制目标跟踪方法,其特征在于,z_pool池化层的计算过程存在如下关系式:

5.根据权利要求2所述的基于旋转等变网络与三重注意力机制目标跟踪方法,其特征在于,在所述步骤2中,通过旋转等变网络对包含全局上下文相关信息的特征图进行旋...

【专利技术属性】
技术研发人员:王军刘坤龙夏燕王员云
申请(专利权)人:南昌工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1