System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于归一化IBN-Net的跨域行人重识别方法技术_技高网

一种基于归一化IBN-Net的跨域行人重识别方法技术

技术编号:41327791 阅读:4 留言:0更新日期:2024-05-13 15:05
一种基于归一化IBN‑Net的跨域行人重识别方法,解决现有跨域行人重识别方法中不同数据集之间特征差异较大的问题。三次优化结合了实例归一化和批归一化的网络结构,用于解决跨领域图像分类任务中的特征差异问题。通过充分利用外观特征和结构特征,归一化IBN‑Net能够提高模型的泛化性能,对不同领域的图像数据具有更好的适应性;在主干网络中融合了SimAM注意力机制,SimAM能够学习到行人图像中的空间和强度方面的注意力权重,并抑制对任务不相关或冗余的特征。这种选择性地增强特征表示的能力有助于提高网络的判别性和泛化能力,使得IBN‑Net在图像分类等任务中具有更好的性能。

【技术实现步骤摘要】

本专利技术涉及计算机视觉领域中的跨域行人重识别技术,具体涉及一种基于归一化ibn-net的跨域行人重识别方法。


技术介绍

1、行人重识别利用计算机视觉技术,旨在通过提取和匹配图像或视频中的行人特征,实现对不同场景下行人身份的准确识别和跟踪。这一技术在智能安防、智能交通、视频监控等领域得到广泛应用。随着深度学习技术的推广和应用,有监督学习在行人重识别领域取得了显著的准确率提升。然而,有监督学习存在一定局限性,即依赖带有真实标签的数据集,需数据集提供有监督的训练样本,以便模型能够学习和推广到未见过的数据,在实际应用中难以满足需求。目前所使用的无监督行人重识别方法不需要真实标签,通过利用数据集的内在结构和特征来完成行人重识别任务。

2、针对源域和目标域图像在时间、地点和环境等方面差异较大的问题,采用一个带有真实标签的预训练源域数据集,而无需目标域数据集的标签信息,这种方法可以适应不同环境下目标域数据分布的差异,从而提高跨域行人重识别的准确性。

3、为了解决跨域图像分类任务中的特征差异问题,本专利技术将实例归一化和批归一化网络结构进行三次结合,充分获取源域图像的结构特征和外观特征,提高模型的泛化能力,达到对不同域图像适应性强的目的。此外,本专利技术同时将simam注意力机制融入ibn-net网络,提出一种归一化ibn-net网络模型,使ibn-net网络可以自动学习到关键的特征,并抑制对任务不相关或冗余的特征。这种选择性地增强特征表示的能力有助于提高网络的判别性和泛化能力,使得ibn-net在图像分类等任务中具有更好的性能,弥补现有方法的缺点。本专利技术较并联一次实例归一化和批归一化的网络结构提高了准确率,对于market-1501迁移到dukemtmc-reid,本文方法的rank-1和map分别提高了1.6个百分点及2.3个百分点;对于dukemtmc-reid迁移到market-1501,本文方法的rank-1和map分别提高了5.9个百分点和8.9个百分点。


技术实现思路

1、本专利技术为解决现有跨域行人重识别方法中不同数据集之间特征差异较大的问题,设计了基于归一化ibn-net网络模型,利用融合后的网络结构进行训练,提升模型对图像外观变化的适应性,提高特征的表达能力。归一化ibn-net网络模型采用了实例归一化(instance normalization)和批归一化(batch normalization)的三次融合,并且在每个残差块的conv2卷积层后加入三维注意力机制(simam),可以对特征进行更深层次的规范化处理。每一层的实例归一化层都能够学习和调整特征的均值和方差,从而增强特征表示的能力。这有助于网络提取更丰富、更有判别性的特征,从而提高模型的性能。深层网络的非线性能力是实现复杂模式建模和表达的关键。通过在不同层级引入实例归一化层,可以增加网络的深度,并且每一层都能够对特征进行归一化处理。多层实例归一化层可以减少特征的统计差异,提高网络的鲁棒性,这有助于提高网络对输入数据的稳定性和一致性,增强模型的泛化能力。该方法可由以下步骤实现:

2、步骤一、下载开源数据集market-1501、dukemtmc-reid,使每个数据集分别作为源域和目标域,并将所有图片裁剪为256*256大小。

3、步骤二、得到低级特征的图像通过归一化的ibn-net网络交替使用instancenormalization(in)和batch normalization(bn)来调整特征图的均值和方差。

4、步骤三、在归一化的ibn-net网络的每个layer层中的bottleneck层下的conv2层之后融合simam注意力机制。

5、步骤四、图像转化为张量,送入到网络中进行特征提取。

6、步骤五、在源域数据集上对模型进行预训练,并将预训练模型的参数作为初始化参数,用于训练目标域数据集。

7、本专利技术的优点及有益效果如下:

8、1、本专利技术提供了一种新的跨域行人重识别网络模型,基于归一化ibn-net网络模型可以有效提高网络的判别性和泛化能力,并提高了准确率;

9、2、本专利技术提出了一种实例归一化(instance normalization)和批归一化(batchnormalization)的多次结合并同时融合注意力机制的新方法,这有助于提高网络的非线性能力,更好地适应数据的复杂分布,增强模型的表达能力。

10、3、本专利技术解决了ibn-net网络特征提取和图像分类较弱的问题,归一化ibn-net网络通过引入融合模块,能够有效地将不同层级的特征信息融合在一起,提高了模型对图像信息的表示能力,从而有助于更好地理解图像内容。

本文档来自技高网...

【技术保护点】

1.一种基于归一化IBN-Net网络的跨域行人重识别方法,其特征是:该方法可由以下步骤实现:

2.根据权利要求1所述的一种基于归一化IBN-Net的跨域行人重识别方法,其特征在于:步骤二中,多层实例归一化不仅归一化网络层的输入,还在不同深度的网络层之间引入额外的归一化层,进一步减小了特征的统计差异。这有助于确保在网络不同层级中的特征分布相对一致,从而有助于网络更加稳定地学习和收敛。通过减小特征分布的差异,多层实例归一化增加了网络对不同样本和不同输入分布的适应能力。这提高了网络的鲁棒性,使其能够更好地应对数据中的变化和噪声,从而提高了在实际应用中的可靠性。

3.根据权利要求1所述的一种基于归一化IBN-Net的跨域行人重识别方法,其特征在于:步骤三中,在归一化的IBN-Net网络中融入SimAM注意力模块。SimAM模块是一种无参数的注意力模块,在神经科学中,信息丰富的神经元通常表现出与周围神经元不同的放电模式,并可能引发空间上的抑制效应,这意味着激活一个神经元可能会抑制周围未激活的神经元。因此,具有空间抑制效应的神经元可能被视为更重要的元素。通过引入SimAM模块,我们可以在神经网络中模拟这种空间抑制效应,从而更有效地关注重要信息。因此,我们定义了如下能量函数:

4.根据权利要求1所述的一种基于归一化的IBN-Net的跨域行人重识别方法,其特征在于:通过归一化的的网络模型,对输入的图像进行预处理,将其调整为网络的输入大小256×256像素。输入张量256×256通过归一化的并融合注意力机制的IBN-Net网络的卷积层进行前向传播,以提取图像的特征。这些卷积层由权重参数wi和激活函数σ组成。输出Fi可以表示为:

...

【技术特征摘要】

1.一种基于归一化ibn-net网络的跨域行人重识别方法,其特征是:该方法可由以下步骤实现:

2.根据权利要求1所述的一种基于归一化ibn-net的跨域行人重识别方法,其特征在于:步骤二中,多层实例归一化不仅归一化网络层的输入,还在不同深度的网络层之间引入额外的归一化层,进一步减小了特征的统计差异。这有助于确保在网络不同层级中的特征分布相对一致,从而有助于网络更加稳定地学习和收敛。通过减小特征分布的差异,多层实例归一化增加了网络对不同样本和不同输入分布的适应能力。这提高了网络的鲁棒性,使其能够更好地应对数据中的变化和噪声,从而提高了在实际应用中的可靠性。

3.根据权利要求1所述的一种基于归一化ibn-net的跨域行人重识别方法,其特征在于:步骤三中,在归一化的ibn-net网络中融入simam注意力模...

【专利技术属性】
技术研发人员:白雪梅王澳胡汉平张晨洁王云鹏张子恒张庭瑞
申请(专利权)人:长春理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1