【技术实现步骤摘要】
一种基于自适应行人对齐的跨模态行人重识别方法
[0001]本专利技术涉及一种基于自适应行人对齐的跨模态行人重识别方法,以及一种新的网络模型MAPAN(Multipath Adaptive Pedestrian Alignment Network),涉及视频智能监控领域中的跨模态行人重识别问题,属于计算机视觉与智能信息处理领域。
技术介绍
[0002]行人重识别(Re-Identification)是计算机视觉领域中的一种技术,旨在匹配不同摄像机监控视频中具有相同身份(通常使用数字代替)的特定行人,通常被认为是图像检索的一个子问题。不同摄像机拍摄的行人图像,由于视角、行人姿态变化、光照变化等原因,可能会造成行人外观上的差异,也可能存在摄像机分辨率低、遮挡等多种挑战。行人重识别在视频监控,智能安防等领域开阔的应用前景,引起了工业界和学术界的广泛关注,使其成为计算机视觉领域一个既很有研究价值又极具挑战性的研究热点。
[0003]近年来,传统的行人重识别研究已经取得了巨大的进步,然而,传统的行人重识别都是利用可见光图像来匹配可见光图像,但是,在实际的应用场景中,可见光摄像机在夜晚是完全无法捕捉到清晰的图像的,难以满足视频智能监控系统的全天候视频分析的要求。随着社会和技术的发展,如今大部分的摄像机都配备了红外摄像功能,可以捕获行人夜晚或者白天的红外热像信息,为可见光图像以及红外图像的跨模态行人重识别VT-REID(Visible Thermal Cross-modality Person Re-identificati ...
【技术保护点】
【技术特征摘要】
1.一种基于自适应行人对齐的跨模态行人重识别方法,其特征在于以下步骤:(1)分别使用红外图像分支,可见光基础分支中的残差网络模型提取红外图像Z的特征φ(Z)和可见光图像X的特征φ(X);(2)利用可见光分支中提取的第五残差块特征,在网格网络中线性回归一组仿射变换参数A
θ
,并生成图像变换网格,再通过双线性采样生成对齐矫正后的图像X
′
;(3)通过仿射变换分支中的残差网络对矫正图像X
′
提取特征φ
′
(X
′
)后,将其与原可见光分支提取的特征φ(X)通过加权相加的方式融合,即将λφ(X)+(1-λ)φ
′
(X
′
)整体作为可见光图像的最终特征,再与红外图像Z的特征φ(Z)进行度量学习;(4)将红外图像的特征φ(Z)和可见光图像的特征λφ(X)+(1-λ)φ
′
(X
′
)映射到同一个特征空间中,结合身份损失函数和最难批次采样损失函数进行训练,最终提高跨模态行人重识别精度。2.根据权利要求1所述的方法,其特征在于步骤(1)中多路径网络对输入图片每个批次的采样策略是,在每个批次中,对于包含N个身份(ID)的数据集,首先随机选择P个身份,对于每个行人身份,随机获取K张可见光行人图像和K张红外行人图像,从而将2
×
P
×
K张行人图像送进网络中训练;多路径网络各分支分别提取红外图像Z和可见光图像X的深层次特征,分别使用φ(Z)和φ(X)表示;所有输出特征向量的长度为2048。3.根据权利要求1所述的方法,其特征在于步骤(2)中本发明利用可见光基础分支提取的高层特征(第五残差块特征)线性回归出一组仿射变换参数A
θ
,然后通过下式建立仿射变换前后图像的坐标对应关系:其中,是目标图像的规则网格中的第k个目标坐标,是输入图像中采样点的源坐标,A
θ
是仿射变换矩阵,其中θ
11
,θ
12
,θ
21
和θ
22
主要控制转换图像的大小和旋转变化,而θ
13
和θ
23
控制转换图像的偏移;仿射变换时使用双线性采样对图像网格进行采样,因此双线性采样器的输入图像X和输出图像X
′
之间的对应关系为:其中,X
′
表示目标图像中每个通道中坐标(i,j)位置的像素值,X
nm
表示源图像中每个通道中(n,m)坐标处的像素值,H和W表示目标图像(或源图像)的高度和宽度;双线性采样是连续可导的,因此上述方程式是连续可导并允许梯度反向传播,从而实现自适应行人对齐;关于X
nm
和的偏导数分别为:
显然,X
′
ij
对的偏导数完全类似于X
′
i,j
对的偏导数4.根据权利要求1所述的方法,其特征在于步骤(3)中通过三个残差网络分支,可以得到特征φ(Z),φ(X),φ
′
(X
′
);本发明选择通过加权相加的方式融合φ(X)和...
【专利技术属性】
技术研发人员:何小海,李波,吴晓红,刘强,陈洪刚,卿粼波,滕奇志,
申请(专利权)人:四川大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。