基于多级跨模态联合对齐的行人重识别方法及系统技术方案

技术编号:42110906 阅读:25 留言:0更新日期:2024-07-25 00:33
本发明专利技术提供一种基于多级跨模态联合对齐的行人重识别方法及系统,属于机器视觉图像处理技术领域,获取待识别的图像数据;利用预先训练好的行人重识别模型对获取的待识别的图像进行处理,得到图像中行人重识别结果。本发明专利技术提出可见红外模态协调器并以加权灰度、跨通道剪切混合和频谱抖动协调器三种不同的方式,减轻了可见光和红外图像之间的差异,弥合了图像级别的模态差距;引入具有可训练参数的模态分布适配器,捕获特征图的空间统计特征并自适应地对齐不同模态的特征分布,减少特征级别的模态差距;引入跨模态检索损失,减少VI‑ReID目标层面的差距;引入多光谱增强排序策略,增强了模型的鲁棒性和跨模态检索能力。

【技术实现步骤摘要】

本专利技术涉及机器视觉图像处理,具体涉及一种基于多级跨模态联合对齐的行人重识别方法及系统


技术介绍

1、可见光-红外行人重新识别(vi-reid)是一项具有挑战性的跨模态图像检索任务,旨在匹配可见光和红外相机上的行人图像。为了解决模态差距,现有的主流方法采用一种学习范式,将图像检索任务转换为具有交叉熵损失和辅助度量学习损失的图像分类任务。这些损失的核心思想是最小化类内距离并最大化类间距离。尽管这类方法提高了性能,但任务转换的同时也导致训练和测试阶段的目标不一致,为vi-reid任务引入了新的鸿沟。此外,这些方法的优化目标往往包含过多的子损失,给新数据集的调整带来了困难。

2、行人重识别旨在从多个不重叠的摄像机捕获的图像集合中检索特定人的图像。在安防监控领域具有重要的价值和广泛的实际应用。尽管该研究领域经过多年的研究和发展,现有的高性能reid方法主要集中在rgb相机下的单一可见模态。这限制了它们只能在光照条件良好的白天使用。为了克服这一限制并实现全天候智能监控,最近提出的跨模态可见光-红外行人重新识别(vi-reid)任务旨在扩展reid的应本文档来自技高网...

【技术保护点】

1.一种基于多级跨模态联合对齐的行人重识别方法,其特征在于,包括:

2.根据权利要求1所述的基于多级跨模态联合对齐的行人重识别方法,其特征在于,可见红外模态协调器遵循,包括:将可见图像转换为接近红外图像的表示,从而弥合模态之间的差距;充分利用原始可见图像中存在的色谱,同时避免不必要的信息丢失;所述可见红外模态协调器包括加权灰度协调器、跨通道剪切混合协调器和频谱抖动协调器。

3.根据权利要求1所述的基于多级跨模态联合对齐的行人重识别方法,其特征在于,模态分布适配器由三个连续的子模块组成:

4.根据权利要求1所述的基于多级跨模态联合对齐的行人重识别方法,其...

【技术特征摘要】

1.一种基于多级跨模态联合对齐的行人重识别方法,其特征在于,包括:

2.根据权利要求1所述的基于多级跨模态联合对齐的行人重识别方法,其特征在于,可见红外模态协调器遵循,包括:将可见图像转换为接近红外图像的表示,从而弥合模态之间的差距;充分利用原始可见图像中存在的色谱,同时避免不必要的信息丢失;所述可见红外模态协调器包括加权灰度协调器、跨通道剪切混合协调器和频谱抖动协调器。

3.根据权利要求1所述的基于多级跨模态联合对齐的行人重识别方法,其特征在于,模态分布适配器由三个连续的子模块组成:

4.根据权利要求1所述的基于多级跨模态联合对齐的行人重识别方法,其特征在于,跨模态检索损失包括:跨模态检索损失被定义为使用训练批次中的所有查询样本计算出的秩距离的平均值;

5.根据权利要求1所述的基于多级跨模态联合对齐的行人重识别方法,其特征在于,多光谱增强排名策略的目标是结合图像中的多光谱信息,计算它们之间的高阶距离;

6.根据权利要求5所述的基于多级跨模态联合对齐的行人...

【专利技术属性】
技术研发人员:金一梁腾飞阮弘基苏楦雯王伟王涛李浥东
申请(专利权)人:北京交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1