当前位置: 首页 > 专利查询>复旦大学专利>正文

一种基于多分支联合学习的遮挡行人重识别方法及系统技术方案

技术编号:37143558 阅读:16 留言:0更新日期:2023-04-06 21:52
本发明专利技术涉及一种基于多分支联合学习的遮挡行人重识别方法及系统,涉及图像识别领域,该方法包括:将待识别行人图像输入行人重识别模型中,输出行人重识别结果;行人重识别模型为根据训练集对教师网络和学生网络进行联合学习训练获得的;教师网络和学生网络均为多分支网络,多分支网络包括共享层、全局分支、局部分支和输出层;全局分支对特征图进行全局平均池化;局部分支对获得的多个不同尺度的特征向量进行融合;输出层对全局分支和局部分支的输出进行特征融合,获得特征融合向量,将特征融合向量与查询库中行人图像的特征向量的余弦相似度最高的行人图像对应的行人身份作为行人重识别模型的输出。本发明专利技术提高了遮挡行人重识别的准确性。识别的准确性。识别的准确性。

【技术实现步骤摘要】
一种基于多分支联合学习的遮挡行人重识别方法及系统


[0001]本专利技术涉及图像识别领域,特别是涉及一种基于多分支联合学习的遮挡行人重识别方法及系统。

技术介绍

[0002]随着人工智能的快速发展以及深度学习技术的进步,基于深度学习的行人重识别方法得到了广泛的关注,考虑到在现实场景下相机捕获到的行人图像往往会存在大量的遮挡,虽然很多工作在行人重识别领域已经取得了不错的效果,但是在面对大量遮挡场景时这些工作仍未能取得令人满意的效果。
[0003]得益于卷积神经网络的快速发展,基于卷积神经网络的行人重识别研究取得了较为广泛的关注,并且取得了不错的成果。而遮挡行人重识别任务旨在实现在存在大规模遮挡的情况下,模型依旧能够完成高效精准的行人检索以及匹配。相比较于一般的行人重识别任务,遮挡行人重识别任务对深度学习模型提出了更高的要求。
[0004]虽然现有的一些工作在遮挡行人重识别任务中取得了一定的成果,但是依旧存在着很多的问题。首先,很多遮挡行人重识别工作完全依赖于局部的特征,虽然局部特征能够有效的避免一些遮挡信息的干扰,但是这种方法却忽略了全局的语义信息,同样地一些基于全局特征的遮挡行人重识别方法难以做到对局部关键区域的关注,会受到更多遮挡因素的干扰。对于遮挡行人重识别任务而言,全局特征和局部特征都是重要的并且具有一定的互补性,如果只关注其中一种,或者忽略了两者之间的联系性,就难以得到全面的,具有判别性的行人特征用于行人的匹配和检索。

技术实现思路

[0005]本专利技术的目的是提供一种基于多分支联合学习的遮挡行人重识别方法及系统,提高了遮挡行人重识别的准确性。
[0006]为实现上述目的,本专利技术提供了如下方案:
[0007]一种基于多分支联合学习的遮挡行人重识别方法,包括:
[0008]获取待识别行人图像;
[0009]将所述待识别行人图像输入行人重识别模型中,输出行人重识别结果;所述行人重识别模型为根据训练集对教师网络和学生网络进行联合学习训练获得的;
[0010]所述教师网络和所述学生网络均为多分支网络,所述多分支网络包括共享层、全局分支、局部分支和输出层;所述共享层用于对所述待识别行人图像进行特征提取,输出特征图;所述全局分支用于对所述特征图进行特征提取后进行全局平均池化;所述局部分支用于对所述特征图进行特征提取后进行区域池化,并对获得的多个不同尺度的特征向量进行融合;所述输出层对所述全局分支和所述局部分支的输出进行特征融合,获得特征融合向量,将所述特征融合向量与查询库中行人图像的特征向量的余弦相似度最高的行人图像对应的行人身份作为所述行人重识别模型的输出;
[0011]所述查询库中样本图像为有遮挡的行人图像;
[0012]所述训练集中存储有多种行人身份的行人图像。
[0013]可选地,对教师网络和学生网络进行联合学习训练的训练过程包括:
[0014]利用所述教师网络的所述局部分支输出的特征向量作为所述学生网络的所述全局分支的监督信息,利用所述教师网络的所述全局分支输出的特征向量作为所述学生网络的所述局部分支的监督信息,将多轮训练过程中所述学生网络的网络参数进行平均作为所述教师网络的网络参数,将训练设定次数后的所述教师网络作为所述行人重识别模型。
[0015]可选地,对教师网络和学生网络进行联合学习训练的整体损失函数为:
[0016]L
all
=λ1L
center
+λ2L
cam
+λ3L
ce
+λ4L
kl
+λ5L
tri

[0017]其中,L
all
表示整体损失,L
center
表示身份级别相机级别对比损失,L
cam
表示相机级别对比损失,L
ce
表示交叉熵损失,L
kl
表示KL散度损失,L
tri
表示软三元组损失,λ1、λ2、λ3、λ4和λ5均为权重系数;
[0018][0019]其中,q表示样本特征q,k
i
表示所述查询库中第i个行人身份的类中心特征,k
+
表示与样本特征q对应的行人身份的类中心特征,τ为第一对比学习的温度系数,K表示所述训练集中行人身份数量;
[0020][0021]其中,f
ab
表示行人身份为a,拍摄相机为b的样本特征f
ab
,p
ai
表示样本特征f
ab
的正原型,p
j
表示样本特征f
ab
的负原型,τ
c
为第二对比学习温度系数,表示相机级别对比原型的数量,N
neg
为对比学习中的负样本数量,P表示拍摄相机级别的对比原型集合,C表示类中心特征的集合;
[0022]L
ce
=CE(R
sl
,R
tg
)+CE(R
sg
,R
tl
);
[0023]其中,CE()表示交叉熵损失函数,R
sg
表示学生网络中的所述全局分支输出的特征向量与全局类中心之间的相似度关系,R
tg
表示教师网络中的所述全局分支输出的特征向量与全局类中心之间的相似度关系,R
sg
表示学生网络中的所述局部分支输出的特征向量与局部类中心之间的相似度关系,R
tl
表示教师网络中的所述局部分支输出的特征向量与局部类中心之间的相似度关系;
[0024]L
kl
=KL(W
sl
,W
tg
)+KL(W
sg
,W
tl
);
[0025]其中,KL()表示KL散度损失函数,W
sl
表示所述学生网络中的所述局部分支输出的特征向量之间的相似度,W
tg
表示所述教师网络中的所述全局分支输出的特征向量之间的相似度,W
sg
表示所述学生网络中的所述全局分支输出的特征向量之间的相似度,W
tl
表示所述教师网络中的所述局部分支输出的特征向量之间的相似度;
[0026][0027]其中,表示利用所述教师网络的所述全局分支输出的特征向量监督所述学生
网络的所述局部分支输出的损失,表示利用所述教师网络的所述局部分支输出的特征向量监督所述学生网络的所述全局分支输出的损失;
[0028][0029]其中,T
tg
表示由所述教师网络中所述全局分支得到的三元组正负样本对关系,T
sl
表示由所述学生网络中的所述局部分支得到的三元组正负样本对关系,θ

表示所述教师网络的网络参数,θ表示所述学生网络的网络参数,x
sl
表示学生网络的输出,x<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多分支联合学习的遮挡行人重识别方法,其特征在于,包括:获取待识别行人图像;将所述待识别行人图像输入行人重识别模型中,输出行人重识别结果;所述行人重识别模型为根据训练集对教师网络和学生网络进行联合学习训练获得的;所述教师网络和所述学生网络均为多分支网络,所述多分支网络包括共享层、全局分支、局部分支和输出层;所述共享层用于对所述待识别行人图像进行特征提取,输出特征图;所述全局分支用于对所述特征图进行特征提取后进行全局平均池化;所述局部分支用于对所述特征图进行特征提取后进行区域池化,并对获得的多个不同尺度的特征向量进行融合;所述输出层对所述全局分支和所述局部分支的输出进行特征融合,获得特征融合向量,将所述特征融合向量与查询库中行人图像的特征向量的余弦相似度最高的行人图像对应的行人身份作为所述行人重识别模型的输出;所述查询库中样本图像为有遮挡的行人图像;所述训练集中存储有多种行人身份的行人图像。2.根据权利要求1所述的基于多分支联合学习的遮挡行人重识别方法,其特征在于,对教师网络和学生网络进行联合学习训练的训练过程包括:利用所述教师网络的所述局部分支输出的特征向量作为所述学生网络的所述全局分支的监督信息,利用所述教师网络的所述全局分支输出的特征向量作为所述学生网络的所述局部分支的监督信息,将多轮训练过程中所述学生网络的网络参数进行平均作为所述教师网络的网络参数,将训练设定次数后的所述教师网络作为所述行人重识别模型。3.根据权利要求2所述的基于多分支联合学习的遮挡行人重识别方法,其特征在于,对教师网络和学生网络进行联合学习训练的整体损失函数为:L
all
=λ1L
center
+λ2L
cam
+λ3L
ce
+λ4L
kl
+λ5L
tri
;其中,L
all
表示整体损失,L
center
表示身份级别相机级别对比损失,L
cam
表示相机级别对比损失,L
ce
表示交叉熵损失,L
kl
表示KL散度损失,L
tri
表示软三元组损失,λ1、λ2、λ3、λ4和λ5均为权重系数;其中,q表示样本特征q,k
i
表示所述查询库中第i个行人身份的类中心特征,k
+
表示与样本特征q对应的行人身份的类中心特征,τ为第一对比学习的温度系数,K表示所述训练集中行人身份数量;其中,f
ab
表示行人身份为a,拍摄相机为b的样本特征f
ab
,p
ai
表示样本特征f
ab
的正原型,p
j
表示样本特征f
ab
的负原型,τ
c
为第二对比学习温度系数,表示相机级别对比原型的数量,N
neg
为对比学习中的负样本数量,P表示拍摄相机级别的对比原型集合,C表示类中心特征的集合;L
ce
=CE(R
sl
,R
tg
)+CE(R
sg
,R
tl
);其中,CE()表示交叉熵损失函数,R
sg
表示学生网络中的所述全局分支输出的特征向量
与全局类中心之间的...

【专利技术属性】
技术研发人员:沙犇范佳媛甘中学陈涛
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1