【技术实现步骤摘要】
一种基于注意力机制的行人目标对齐方法
[0001]本专利技术涉及一种行人目标对齐
,具体为一种基于注意力机制的行人目标对齐方法。
技术介绍
[0002]行人目标对齐是一种从行人图像序列中识别初始目标区域,并在后续跨摄像头跨场景下检索该目标的技术。该技术可以作为人脸识别技术的重要补充,已被广泛应用于行人检测、视频监控、动作识别、骨架关键点检测及姿态识别等多种军事及民用领域。
[0003]近年来,行人目标对齐特别是复杂背景下的行人目标对齐问题逐渐成为研究热点,提出了多种行人目标对齐技术和方法。其中,基于注意力机制的方法凭借优异的性能和较快的运行速度,获得了学术界和工业界的青睐。基于显著性学习的目标识别方法将目标行人显著性特征加入补丁匹配中,使得算法能够有效地找到有区别且可靠的补丁匹配特征。注意力融合卷积神经网络的算法将硬区域和软像素联合学习,实现优化图像未对准情况的目标对齐。基于时空注意力的算法利用多个空间注意力算法提取每个图像帧的有用部位信息,并且通过时间注意力模型整合输出,允许从所有帧中提取可利用的部位信息,提 ...
【技术保护点】
【技术特征摘要】
1.一种基于注意力机制的行人目标对齐方法,其特征是:包括以下步骤:步骤1:基于注意力机制的残差网络计算图像的特征图;步骤1.1:利用包含一次卷积块的CNN层粗略提取I的特征。步骤1.2:利用残差网络的第一个残差块,得到目标中间特征张量X∈R
C
×
H
×
W
,其中R为实数集合,W、H、C分别为特征图的宽度、高度和通道数;步骤1.3:构造空间关系感知注意块,将每个空间位置上的C维特征向量作为特征节点,用于学习大小为H
×
W的空间注意图:步骤1.3.1:扫描空间位置,将N个特征节点表示为x
i
∈R
C
,其中i=1,...,N;步骤1.3.2:计算节点i与节点j之间的成对关系r
i,j
:其中,ReLU(
·
)表示线性整流函数,s1是一个预定义的正整数,用于控制尺寸缩减率。类似地,计算从节点j到节点i的成对关系为r
j,i
。使用(r
i,j
,r
j,i
)来描述x
i
和x
j
之间的双向关系,使用亲和矩阵R
s
∈R
N
×
N
表示所有节点之间的成对关系;步骤1.3.3:计算第i个特征节点的关系向量r
i
=[R
s
(i,:),R
s
(:,i)]∈R
2N
,其中i=1,2,...,N;步骤1.3.4:计算空间关系感知特征y
i
:y
i
=[pool
C
(ReLU(W
ψ
r
i
)),ReLU(W
φ
r
i
)]其中,pool
C
(
·
)表示沿着通道维度的全局平均池化操作。这样操作可以充分利用与该特征相关的全局结构信息和局部原始信息;步骤1.3.5:根据计算第i个特征节点的空间注意力值a
i
:a
i
=Sigmoid(W2ReLU(W1y
i
))其中,权值W1和W2通过1
×
1的卷积实...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。