一种基于注意力机制的无监督目标重识别方法及系统技术方案

技术编号:31831976 阅读:30 留言:0更新日期:2022-01-12 13:08
本发明专利技术公开了一种基于注意力机制的无监督目标重识别方法及系统,包括:确定通道注意力机制和空间注意力机制;将所述通道注意力机制和空间注意力机制加入至基准卷积神经网络模型,以获取初始的目标重识别模型;基于已知身份标签的第一源数据集和未知身份标签的第二源数据集对当前的目标重识别模型进行有监督训练和无监督训练,确定交叉熵损失和无监督损失;根据所述交叉熵损失和无监督损失,使用梯度下降算法对当前的目标重识别模型进行优化,并不断迭代,直至损失变化值小于预设损失变化阈值或达到预设得迭代次数时,确定当前的目标重识别模型为最优目标重识别模型;基于所述最优目标重识别模型进行目标重识别,以确定与查询图像匹配的目标图像。与查询图像匹配的目标图像。与查询图像匹配的目标图像。

【技术实现步骤摘要】
一种基于注意力机制的无监督目标重识别方法及系统


[0001]本专利技术涉及目标重识别
,并且更具体地,涉及一种基于注意力机制的无监督目标重识别方法及系统。

技术介绍

[0002]目标重识别在智能视频监控和公共安全中发挥着重要的作用。给定一幅查询图像,目标重识别任务的目标是在图像数据库中匹配来自跨摄像机视角下相同身份的目标图像。传统的目标重识别方法可以分为两类:特征提取和度量学习。近年来,基于深度特征学习的目标重识别系统与手工特征提取方法相比,在性能方面取得了显著的提升。然而,上述方法都需要大量的跨摄像头下的成对标记数据,其限制了在实际应用中的可扩展性。因为对数据集中的大量图像进行人工标记是非常耗时和昂贵的。为了解决这个问题,近年来一些基于无监督的目标重识别方法主要通过在对未标记的数据上进行聚类,或从已标记的源数据域中将知识迁移到目标数据域上。然而,现有的无监督目标重识别方法的模型性能并不令人满意,与有监督算法相比,其性能显著下降。该问题关键在于,由于成对标签的缺失,从未标记数据中学习具有身份信息的可区分性特征是一个非常大的挑战,并且这些数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制的无监督目标重识别方法,其特征在于,所述方法包括:基于图像特征图的通道域信息和空间域信息,确定通道注意力机制和空间注意力机制;将所述通道注意力机制和空间注意力机制加入至基准卷积神经网络模型,以获取初始的目标重识别模型;基于已知身份标签的第一源数据集和未知身份标签的第二源数据集对当前的目标重识别模型进行有监督训练和无监督训练,确定交叉熵损失和无监督损失;根据所述交叉熵损失和无监督损失,使用梯度下降算法对当前的目标重识别模型进行优化,并不断迭代,直至损失变化值小于预设损失变化阈值或达到预设得迭代次数时,确定当前的目标重识别模型为最优目标重识别模型;基于所述最优目标重识别模型进行目标重识别,以确定与查询图像匹配的目标图像。2.根据权利要求1所述的方法,其特征在于,所述通道注意力机制,包括:给定输入张量T∈R
C
×
H
×
W
,采用自适应最大池化AMP操作将其映射到使用全局最大池化GAP操作将每层特征进行聚合,获取特征Z
channel
,包括:基于特征Z
channel
,确定每个通道的权值,包括:S
channel
=σ(F(Z
channel
,W))=σ(W2δ(W1Z
channel
)),使用激活张量S
channel
重新调节原始输入张量T,确定通道注意力机制的输出张量,包括:其中,δ代表非线性激活函数(ReLU),W1∈R
C/r
×
C
,和W2∈R
C
×
C/r
;r为维数缩减比例;特征图T
c
∈R
H
×
W
,U
channel
∈R
C
×
H
×
W
。3.根据权利要求1所述的方法,其特征在于,所述空间注意力机制,包括:给定输入张量T∈R
C
×
H
×
W
,给定输入张量T∈R
C
×
H
×
W
,采用自适应最大池化AMP操作将其映射到使用全局最大池化GAP将张量T'在空间上分成个向量,对每个向量使用一维全局平均池化操作以整合所有通道上的特征,以整合所有通道上的特征,包括:将张量Z
spatial
的尺寸调整为记为张量Z'
spatial
,并使用两个非线性的全连接层来学习不同区域的关系,并使得输出大小等于输入空间尺寸H
×
W,包括:S
spatial
=reshape(σ(F(Z'
spatial
,W)))=reshape(σ(W2δ(W1Z'
spatial
))),使用激活张量S
spatial
重新调节原始输入张量T,确定空间注意力机制的输出张量,包括:其中,δ代表非线性激活函数ReLU,和reshape(
·
)函数代表
将非线性激活函数得到结果的尺寸调整为H
×
W;特征图T
x,y
∈R
C
,U
spatial
∈R
C
×
H
×
W
。4.根据权利要求1所述的方法,其特征在于,所述方法利用如下方式确定交叉熵损失,包括:其中,L
src
为交叉熵损失;n
s
为模型训练的批次大小;log(y
s,i
|x
s,i
)为第一源数据集中每幅图像x
s,i
属于身份标签y
s,i
的概率值,通过全连接层和SoftMax激活层计算得到。5.根据权利要求1所述的方法,其特征在于,所述方法利用如下方式确定无监督损失,包括:L
tgt
=aL
cam
+bL
triplet
+cL
neibor
,,L
cam


log(i|X
t,i
),),),其中,L
tgt
为无监督损失,a、b和c为预设系数,a+b+c=1;L
neibor
为最近邻损失,w
i,j
为目标图像x
t,i
属于身份j的概率权重,k为基于相似度确定的图像个数,表示目标图像x
t,i
对应的最相似的k幅图像;L
cam
为交叉熵损失,原始图像x
t,i
和对应的生成图像为同一个类别;L
triplet
为三元组损失;P为目标图像x
t,i
在每个训练批次中对应的正样本集,N为对应的困难负样本集;f(
·
)为特征映射函数,用以将目标图像映射为特征,指特征提取网络;表示L2范数的平方。6.一种基于注意力机制的无监督目标重识别系统,其特征在于,所述系统包括:注意...

【专利技术属性】
技术研发人员:魏志强张文锋黄磊
申请(专利权)人:中国海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1