基于混合特征和多尺度融合注意力的目标跟踪方法与系统技术方案

技术编号：45869423 阅读：21 留言：0更新日期：2025-07-19 11:25

本发明专利技术提出一种基于混合特征和多尺度融合注意力的目标跟踪方法与系统，该方法包括：将模板图像和搜索图像输入至主阶段混合特征模块中选择注意力提取模板图像和搜索图像的全局特征，利用卷积操作提取模板图像和搜索图像的局部特征；将主阶段混合特征模块的输出，输入至多尺度融合模块中提取不同尺度特征；将主阶段混合特征模块的输出和多尺度融合模块的输出，输入至次阶段混合特征模块中进行交互融合；将模板图像和搜索图像输入至参数调整后的跟踪模型中，以得到跟踪结果。本发明专利技术通过发明专利技术所述混合特征模块对输入图像的全局特征和局部特征进行提取融合，增强网络对图像细节的捕获能力，在保留局部细节的同时还丰富了上下文信息。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机视觉与图像处理，特别涉及基于混合特征和多尺度融合注意力的目标跟踪方法与系统。

技术介绍

1、视频跟踪是计算机视觉领域的一个重要研究方向，它在自动驾驶、视频监控、交通管理以及高速摄影等多个实际应用领域中发挥着关键作用。视频跟踪的核心任务是在视频序列的第一帧中确定目标对象后，能够在后续帧中准确地预测并定位该目标，从而实现持续跟踪。随着视频跟踪技术的实用性和实时性不断提升，它在日常生活中的应用也日益广泛，其研究价值愈发凸显。然而，由于物体可能发生的形变、快速运动以及遮挡等复杂因素的存在，视频跟踪仍然是一个充满挑战的任务。

2、近年来，transformer架构的引入为计算机视觉领域带来了显著的进步。transformer通过其自注意力机制能够有效地探索连续帧之间的关联，从而获取丰富的上下文信息，进而实现优异的跟踪性能。然而，自注意力机制的一个特点是需要对输入的所有特征进行全面处理。随着视频和图像分辨率的不断提高，这不仅带来了更大的计算负担，还可能引入额外的噪声干扰。此外，自注意力机制主要关注全局信息，忽略了局部

【技术保护点】

1.一种基于混合特征和多尺度融合注意力的目标跟踪方法，其特征在于，所述方法包括如下步骤：

2.根据权利要求1所述的基于混合特征和多尺度融合注意力的目标跟踪方法，其特征在于，在所述步骤2中，将模板图像和搜索图像输入至主阶段混合特征模块中，利用选择注意力机制提取得到模板图像和搜索图像的全局特征，利用卷积操作提取得到模板图像和搜索图像的局部特征，并将模板图像和搜索图像的全局特征与模板图像和搜索图像的局部特征进行融合，得到主阶段混合特征模块的输出，具体包括如下步骤：

3.根据权利要求2所述的基于混合特征和多尺度融合注意力的目标跟踪方法，其特征在于，将模板图像和搜索图像分别...

【技术特征摘要】

1.一种基于混合特征和多尺度融合注意力的目标跟踪方法，其特征在于，所述方法包括如下步骤：

3.根据权利要求2所述的基于混合特征和多尺度融合注意力的目标跟踪方法，其特征在于，将模板图像和搜索图像分别输入至主阶段混合特征模块中，依次进行线性投影处理和点积计算，得到注意力分数矩阵，对应过程存在的关系式如下：

4.根据权利要求3所述的基于混合特征和多尺度融合注意力的目标跟踪方法，其特征在于，在所述步骤3中，将主阶段混合特征模块的输出输入至多尺度融合模块中，并结合通道特征选择分支和空间特征选择分支生成的动态权重，得到多尺度融合模块的输出，具体包括如下步骤：

5.根据权利要求4所述的基于混合特征和多尺度融合注意力的目标跟踪方法，其特征在于，将主阶段混合特征模块的输出，输入至多尺度融合模...

【专利技术属性】
技术研发人员：王军，孙磊，罗书红，安卓，李楠甄，王员云，
申请(专利权)人：南昌工程学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人