基于动态归一化技术的域泛化目标重识别模型构建方法技术

技术编号:39430809 阅读:7 留言:0更新日期:2023-11-19 16:15
本发明专利技术公开了一种基于动态归一化技术的域泛化目标重识别模型构建方法,首先构建动态归一化DN模块,再将动态归一化DN模块插入残差卷积块中,得到DN卷积块,再将DN卷积块应用到ResNet

【技术实现步骤摘要】
基于动态归一化技术的域泛化目标重识别模型构建方法


[0001]本专利技术属于模式识别
,具体涉及一种域泛化目标重识别模型构建方法。

技术介绍

[0002]目标重识别旨在匹配不同摄像机中的相同目标。在同一环境下训练和评估图像时,许多有监督的目标重识别方法取得了较好的效果。然而,当在来自模型未见过的环境的图像上测试时,这些方法的性能往往会显着下降。人们普遍认为,捕捉环境的变化,例如光照、视角和季节的变化会导致数据域偏移,而现有方法在这些变化下并不稳健。对此,域泛化的目标重识别旨在建立一个对数据域变化更鲁棒的、能在未见过的环境中工作的目标重识别模型。
[0003]在过去的工作中,实例归一化被广泛用于通过消除跨特征通道的统计对比来产生数据域表征。但是,删除的统计信息不仅编码了不相关的特定于域的模式,而且还包含可用于对特定域或实例进行识别的判别信息。为了解决这个问题,需要构建一个足够灵活的模块来学习映射函数以结合经过实例归一化处理的归一化特征和非归一化特征。

技术实现思路

[0004]为了克服现有技术的不足,本专利技术提供了一种基于动态归一化技术的域泛化目标重识别模型构建方法,首先构建动态归一化DN模块,再将动态归一化DN模块插入残差卷积块中,得到DN卷积块,再将DN卷积块应用到ResNet

50模型中,命名为基于动态归一化技术的域泛化目标重识别模型;模型在训练阶段访问来自多个源数据域的数据,将每个源域视为一个独立任务,并为这些任务提供一个共享的特征提取器,再采用交叉熵损失和三元组损失的基础上,总体目标为最小化每个数据域中损失的平均值。本专利技术模型可以在消除不相关的特定数据域特征和适应单个数据域或实例之间取得平衡。
[0005]本专利技术解决其技术问题所采用的技术方案包括如下步骤:
[0006]步骤1:构建动态归一化DN模块;
[0007]首先使用尺寸为1
×
1的卷积核调整输入特征的通道维度,再对调整后的特征进行实例归一化操作,之后再使用动态卷积来转换经实例归一化提取的归一化特征;其中,动态卷积的参数根据经实例归一化操作处理前的特征生成;上述操作写为:
[0008][0009]其中,F和F
DTIN
分别是动态归一化DN模块的输入特征和输出特征;C.C.表示用于通道压缩的卷积核尺寸为1
×
1的卷积层,它的作用是在进行实例归一化操作之前将特征的通道维度从C压缩到K;φ
w
(F

)表示自适应参数预测器根据F

产生包括权重和偏置量在内的自适应参数,F

是进行卷积参数预测所采用的特征;avgPool表示空间平均池化操作,此处
执行的是全局空间池化;θ1和θ2表示全连接层FC的参数;
[0010]步骤2:将动态归一化DN模块应用至ResNet

50模型中,ResNet

50模型由4个部分组成,每个部分包含不同数量的残差卷积块,使用DN模块替换残差卷积块中的3
×
3卷积层,得到DN卷积块,再用DN卷积块替换ResNet

50模型第2到第4部分的最后一个残差卷积块;将应用动态归一化DN模块后的模型命名为基于动态归一化技术的域泛化目标重识别模型;此外,在第1个部分之后插入一个实例归一化层用于收敛;
[0011]步骤3:多任务训练策略;
[0012]基于动态归一化技术的域泛化目标重识别模型在训练阶段访问来自多个源数据域的数据,将源数据域简称源域;将源数据域表示为其中S为可用源域的数量,表示第k个源域,第k个源域中的第i个标记样本,为该样本;为该样本的标记信息,即该样本对应的目标ID;N
k
表示第k个源域中的样本数;
[0013]将每个源域视为一个独立任务,并为这些任务提供一个共享的特征提取器;对每个源域创建一个目标ID分类器来执行目标ID分类,第k个分类器的标签空间为第k个源域中的所有目标ID;对各样本经过目标ID分类器的结果与其标记信息应用交叉熵损失;对从第k个源域随机采样的样本应用三元组损失;多任务训练策略的总体目标为最小化每个数据域中损失的平均值,因此,总体损失函数表示为如下公式:
[0014][0015]其中,N
k
则表示第k个源域中的样本数,和分别是随机抓取的的正样本和负样本;ψ表示基于动态归一化技术的域泛化目标重识别模型;L
c.e.
和L
tri.
分别表示交叉熵损失和三元组损失。
[0016]优选地,所述K=64。
[0017]本专利技术的有益效果如下:
[0018]本专利技术可以构建一个具有动态特性的特征提取模型,该模型在对未见数据域的图像提取特征时,可以根据当前输入图像的自有信息和便于判别的信息动态地进行特征提取,实现在消除不相关的特定数据域特征和适应单个数据域或实例之间取得平衡,帮助更好地进行域泛化目标重识别。
附图说明
[0019]图1为本专利技术模型框架图。
具体实施方式
[0020]下面结合附图和实施例对本专利技术进一步说明。
[0021]为了解决目标重识别任务中数据域变化对模型性能的负面影响,更好地提取数据域表征,本专利技术提出了一种基于动态归一化技术的域泛化目标重识别模型,该模型可以在消除不相关的特定数据域特征和适应单个数据域或实例之间取得平衡。其结构如图1所示,本专利技术的主要工作包括动态归一化DN模块和多任务训练策略两部分。
[0022]1、动态归一化DN模块及其部署
[0023]本专利技术将动态卷积与实例归一化集成融合,从而克服实例归一化的缺点,并通过动态卷积将归一化特征自适应地重新校准,得到能适应各个域和实例的新表示,这就是本专利技术提出的动态归一化DN模块(Dynamically Normalization Module)。
[0024]如图1(c)所示,在动态归一化DN模块中,本专利技术首先使用尺寸为1
×
1的卷积核调整输入特征的通道维度,再对调整后的特征进行实例归一化操作,之后再使用动态卷积来转换经实例归一化提取的归一化特征,其中,动态卷积的参数根据经实例归一化操作处理前的特征生成。在这样的设计思路之下,实例归一化操作可以去除输入特征中编码在特征通道的均值和标准差中的数据域自有信息,尽量排除概率分布不同对特征提取的影响,随后的动态卷积操作可以根据输入的数据域级特征和实例级特征自适应地调整参数以抓取敏感内容,补偿实例归一化操作中损失的表征信息,有效捕获有利于目标重识别任务的表征信息。上述操作可以写为:
[0025][0026]其中,F和F
DTIN
分别是动态归一化DN模块的输入特征和输出特征;C.C.表示用于通道压缩的卷积核尺寸为1
×
1的卷积层,它的作用是在进行实例归一化操作之前将特征的通道维度从C压缩到K(K=64);φ
w本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于动态归一化技术的域泛化目标重识别模型构建方法,其特征在于,包括如下步骤:步骤1:构建动态归一化DN模块;首先使用尺寸为1
×
1的卷积核调整输入特征的通道维度,再对调整后的特征进行实例归一化操作,之后再使用动态卷积来转换经实例归一化提取的归一化特征;其中,动态卷积的参数根据经实例归一化操作处理前的特征生成;上述操作写为:其中,F和F
DTIN
分别是动态归一化DN模块的输入特征和输出特征;C.C.表示用于通道压缩的卷积核尺寸为1
×
1的卷积层,它的作用是在进行实例归一化操作之前将特征的通道维度从C压缩到K;φ
w
(F

)表示自适应参数预测器根据F

产生包括权重和偏置量在内的自适应参数,F

是进行卷积参数预测所采用的特征;avgPool表示空间平均池化操作,此处执行的是全局空间池化;θ1和θ2表示全连接层FC的参数;步骤2:将动态归一化DN模块应用至ResNet

50模型中,ResNet

50模型由4个部分组成,每个部分包含不同数量的残差卷积块,使用DN模块替换残差卷积块中的3
×
3卷积层,得到DN卷积块,再用DN卷积块替换ResNet

【专利技术属性】
技术研发人员:王鹏吴瑞祺矫炳亮陈之雨张艳宁
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1