【技术实现步骤摘要】
一种用于行人重识别的背景抑制方法与系统
[0001]本专利技术涉及行人重识别
,尤其是一种用于行人重识别的背景抑制方法与系统。
技术介绍
[0002]行人重识别的目的是在不重叠的相机视图中匹配相同的行人。随着监控摄像头的快速发展,大量的监控系统部署在公共场所。因此,行人重识别技术近年来受到越来越多的关注,可以在不相交的摄像机视角下捕捉特定目标,并成为视频监控应用中的关键技术。在过去的几年中,行人重识别通过深度学习技术获得了先进的性能。
[0003]由于行人姿态变换、视角变化、光照强度变化、背景干扰等因素的影响,行人重识别是一个具有挑战性的任务。背景干扰可以看作是影响行人重识别系统性能的主要因素之一。当两个人外观信息相似,背景信息又相似时,很容易出现错误识别的情况。
[0004]目前解决行人重识别的背景干扰主要是利用分割算法或者行人解析算法(例如:Mask R
‑
CNN或者LIP_JPPNet)来滤除原始图像中的背景。然而,分割算法是在COCO数据集上进行训练,而直接在re
‑< ...
【技术保护点】
【技术特征摘要】
1.一种用于行人重识别的背景抑制方法,其特征在于,包括以下步骤:S1:利用两路卷积神经网络构建出一个双流网络,所述双流网络包括:第一路网络和第二路网络,其中所述第一路网络和所述第二路网络都使用ResNet50模型,且其中所述第一路网络和所述第二路网络均由相同数量的若干层残差卷积块构成;S2:将待识别的原始图像滤除背景后获得前景图像,将所述原始图像作为所述第一路网络的第一层残差卷积块的输入,同时将所述前景图像作为所述第二路网络的第一层残差卷积块的输入;S3:计算所述第一路网络中每一层的残差卷积块的输出与所述第二路网络中对应层的残差卷积块的输出进行通道级联后得到的级联特征信息,将所述级联特征信息作为所述第二路网络中的下一层残差卷积块的输入,同时将所述第一路网络中每一层的残差卷积块的输出作为所述第一路网络中的下一层残差卷积块的输入;S4:将所述第一路网络最后一层的特征、所述第二路网络最后一层的特征以及最后一层的所述级联特征信息作为所述双流网络的输出,对所述双流网络的输出分别进行池化操作,再基于三元组损失函数和交叉熵损失函数的结合,对所述池化操作的输出进行监督训练,获得行人重识别模型。2.根据权利要求1所述的方法,其特征在于,所述S4中,将所述第一路网络最后一层的特征、所述第二路网络最后一层的特征以及最后一层的所述级联特征信息作为所述双流网络的输出,对所述双流网络的输出分别进行池化操作,具体包括:S401:获取所述第一路网络的最后一层残差卷积所输出的特征对所述特征进行全局平均池化后获得所述第一路网络的最终特征信息F
P
;S402:获取所述第二路网络的最后一层残差卷积所输出的特征对所述特征进行全局最大池化后获得所述第二路网络的最终特征信息F
R
;S403:将和进行通道级联获得最终输出对所述最终输出进行全局最大池化后获得特征F
PR
;其中n为所述第一路网络和所述第二路网络的层数。3.根据权利要求1所述的方法,其特征在于,所述S4中,基于三元组损失函数和交叉熵损失函数的结合,对所述池化操作的输出进行监督训练,获得行人重识别模型,具体包括:选择一定数量的用于训练的原始图像,其中包含K类不同的行人身份,且每种行人身份包含K0张不同的图像;针对每张原始图像x
a
,在与所述原始图像x
a
属于同一个行人身份的图像中选择一张相似度距离最大的图像x
p
作为正样本,在与所述原始图像x
a
属于不同行人身份的图像中选择一张相似度距离最小的图像x
n
作为负样本,设定预设的阈值利用以下三元组损失函数对所述双流网络的输出进行监督训练:其中,L
triplet
为三元组损失函数,d(a,p)表示原始图像x
a
和图像x
p
的欧式距离,d(a,n)表示原始图像x
a
和图像x
n
的欧式距离,batch表示训练的批大小,K表示行人身份的类别个数;
所述监督训练基于标签平滑正则化的交叉熵损失函数预测每张原始图像属于某一类行人身份的概率,所述标签平滑正则化的交叉熵损失函数由如下公式表示:其中ε∈[0,1],k表示所述用于训练的原始图像中行人身份的类别,p(k)表示所述原始图像经过预测得到的属于k类行人身份的概率。4.根据权利要求2所述的方法,其特征在于,所述第一路网络的最终特征信息F
P
具体根据以下特征提取表达式给出:F
P
...
【专利技术属性】
技术研发人员:吴俊毅,姚灿荣,高志鹏,赵建强,杜新胜,
申请(专利权)人:厦门市美亚柏科信息股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。