基于Mamba视觉混合模块的目标跟踪方法与系统技术方案

技术编号:45804933 阅读:21 留言:0更新日期:2025-07-11 20:20
本发明专利技术提出一种基于Mamba视觉混合模块的目标跟踪方法与系统,该方法包括:将搜索图像和模板图像输入至Mamba视觉混合模块中,提取并叠加全局上下文信息和局部细节信息;将Mamba视觉混合模块的输出输入至特征融合模块中进行融合;将特征融合模块的输出利用特征提升模块进行特征增强,得到增强后的特征;用大规模数据集对优化后的跟踪模型进行预训练,并对跟踪模型的参数进行更新;将搜索图像和模板图像输入至参数更新后的跟踪模型中,得到跟踪结果。本发明专利技术设计特征聚合网络,利用图像状态空间模块整合搜索区域的历史状态信息,将历史状态信息与交互后的特征沿通道方向进行拼接,通过卷积、激活、归一化、跳跃连接的方式实现特征的有效聚合过滤不相关信息。

【技术实现步骤摘要】

本专利技术涉及计算机视觉与图像处理,特别涉及基于mamba视觉混合模块的目标跟踪方法与系统。


技术介绍

1、目标跟踪是计算机视觉应用的一个基本任务,旨在给定跟踪目标的情况下,在连续的视频帧中定位和标记目标对象。目前广泛应用于自动驾驶、生物医学、室内外监控、高速路口摄像、无人机与机器人、人机交互等领域。尽管这些年目标跟踪技术得到了快速发展,但在实际应用时仍然面临如遮挡、形变、背景模糊、相似物体干扰等挑战,因此目标跟踪技术仍然有很大的进步空间。

2、transformer的出现和应用进一步推动了目标跟踪技术的发展。它可以通过注意力机制来获取视频图像的上下文信息,通过多层网络架构和反向传播算法等降低损失自动关注模型感兴趣的区域,从而提升跟踪性能。目前大多数的跟踪算法都以transformer为基础,且取得了非常好的跟踪效果,但注意力机制专注于捕获全局信息,丢失掉许多关键的局部信息,这对于跟踪器的性能会有比较大的影响。将局部信息和全局信息结合起来,是提升跟踪器性能的一个重要方向。

3、基于状态空间模型的mamba结构广泛应用于各个领域。状态本文档来自技高网...

【技术保护点】

1.一种基于Mamba视觉混合模块的目标跟踪方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的基于Mamba视觉混合模块的目标跟踪方法,其特征在于,在所述步骤2中,将搜索图像和模板图像输入至Mamba视觉混合模块中,提取并叠加全局上下文信息和局部细节信息,得到Mamba视觉混合模块的输出,具体包括如下步骤:

3.根据权利要求2所述的基于Mamba视觉混合模块的目标跟踪方法,其特征在于,将模板图像的原始特征标记序列输入至多头自注意力中进行信息提取,对应过程存在的关系式如下:

4.根据权利要求3所述的基于Mamba视觉混合模块的目标跟踪方法...

【技术特征摘要】

1.一种基于mamba视觉混合模块的目标跟踪方法,其特征在于,所述方法包括如下步骤:

2.根据权利要求1所述的基于mamba视觉混合模块的目标跟踪方法,其特征在于,在所述步骤2中,将搜索图像和模板图像输入至mamba视觉混合模块中,提取并叠加全局上下文信息和局部细节信息,得到mamba视觉混合模块的输出,具体包括如下步骤:

3.根据权利要求2所述的基于mamba视觉混合模块的目标跟踪方法,其特征在于,将模板图像的原始特征标记序列输入至多头自注意力中进行信息提取,对应过程存在的关系式如下:

4.根据权利要求3所述的基于mamba视觉混合模块的目标跟踪方法,其特征在于,在所述步骤3中,将mamba视觉混合模块的输出输入至特征融合模块中进行融合,得到特征融合模块的输出,具体包括如下步骤:

5.根据权利要求4所述的基于mamba视觉混合模块的目标跟踪方法,其特征在于,将mamba视觉混合模块的输出输入至特征融合模块中,与整合后搜索区域的历史状态信息依次进行拼接操作、卷积激活操作和残差连接操作,得到特征融合模块的输出,对应过程存在的关系式如下:

6.根据权利要求5所述的基于mamba视觉混合模块的目标跟踪方法,其特征在于,在所述步骤4中,将特征融合模块的输出利用特征提升模块进行特征增强,得到增强后的特征,具体如下步骤:

7.根据权利要求6所述的基于mamba视觉混合模块的...

【专利技术属性】
技术研发人员:王军罗书红孙磊安卓李溢超肖愉蓉
申请(专利权)人:南昌工程学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1