一种基于耦合-解耦特征增强的多模态目标跟踪方法技术

技术编号:46113463 阅读:14 留言:0更新日期:2025-08-15 19:50
本发明专利技术公开了一种基于耦合‑解耦特征增强的多模态目标跟踪方法。针对红外与可见光图像之间存在的模态差异、语义冲突及互补信息利用不足等问题,提出一种耦合‑解耦特征增强模块,以提升多模态图像融合特征的表达能力与判别性。在耦合阶段,利用跨模态交叉注意力将多模态的目标信息进行有效融合,生成包含上下文的混合搜索特征;在解耦阶段,分别对各模态模板进行模态感知的注意力,以自适应获得特有的互补信息,同时保持语义一致。随后使用模内的交互来增强搜索区域的判别特征,从而提升定位准确性。本发明专利技术能够在复杂环境下充分发挥多模态数据的互补优势,提高目标跟踪系统的鲁棒性与精度,适用于各种多传感器融合的视觉任务。

【技术实现步骤摘要】

本专利技术涉及图像处理及目标跟踪领域,具体涉及一种基于耦合-解耦交互的多模态目标跟踪方法。


技术介绍

1、多模态视觉跟踪作为目标跟踪领域的重要分支,在安防监控、自动驾驶、智能感知等实际应用中发挥着关键作用,具有广泛的应用前景和重要的研究意义。该任务旨在利用来自不同模态的图像信息(如红外与可见光)实现对目标的鲁棒跟踪,以应对单一模态在光照变化、遮挡、背景干扰等复杂场景中表现不佳的问题。红外图像能够在低照度甚至无光条件下提供稳定的目标热辐射信息,而可见光图像则更擅长表达物体的细节纹理与结构轮廓。两种模态在感知能力上的互补性,为构建更加可靠的跟踪系统提供了可能。近年来,随着传感器技术的快速发展和计算能力的显著提升,多模态视觉跟踪技术已逐步从理论研究走向实际应用,并在军事侦察、智能交通、工业检测等多个关键领域展现出巨大潜力。

2、由于红外与可见光在成像机制、语义分布和统计特性上存在显著差异,模态间的信息融合往往会导致冗余增强、语义错配甚至目标特征被淹没的问题。具体而言,这种差异主要体现在以下几个方面:首先,在成像原理上,红外图像反映的是目标的辐射特性,本文档来自技高网...

【技术保护点】

1.一种基于耦合-解耦特征增强的多模态目标跟踪方法,其特征在于,包括以下步骤:

2.根据权利要求1所述基于耦合-解耦特征增强的多模态目标跟踪方法,其特征在于:步骤一中,可见光和热红外图像的模板和搜索区域图像首先被划分为不重叠的图像块,大小为,将其展平得到四个图像序列后,分别通过嵌入层,并添加位置信息得到对应的特征向量,具体计算过程如下:

3.根据权利要求1所述基于耦合-解耦特征增强的多模态目标跟踪方法,其特征在于:步骤二中,通过两个对称分支的多层编码器,使用多头注意力对各模态模板和搜索区域进行联合特征提取和关系建模,可见光分支的具体计算过程如下

4....

【技术特征摘要】

1.一种基于耦合-解耦特征增强的多模态目标跟踪方法,其特征在于,包括以下步骤:

2.根据权利要求1所述基于耦合-解耦特征增强的多模态目标跟踪方法,其特征在于:步骤一中,可见光和热红外图像的模板和搜索区域图像首先被划分为不重叠的图像块,大小为,将其展平得到四个图像序列后,分别通过嵌入层,并添加位置信息得到对应的特征向量,具体计算过程如下:

3.根据权利要求1所述基于耦合-解耦特征增强的多模态目标跟踪方法,其特征在于:步骤二中,通过两个对称分支的多层编码器,使用多头注意力对各模态模板和搜索区域进行联合特征提取和关系建模,可见光分支的具体计算过程如下:

4.根据权利要求1所述基于耦合-解耦特征增强的多模态目标跟踪方法,其特征在于:步骤三中所述的目标感知的跨模态交叉注意力计算过程如下:

...

【专利技术属性】
技术研发人员:李美惠罗彬欣刘东旭
申请(专利权)人:中国科学院光电技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1