【技术实现步骤摘要】
行人重识别方法、装置及计算机设备
本专利技术涉及计算机视觉
,特别是涉及行人重识别方法、装置及计算机设备。
技术介绍
随着人们对公共安全问题的重视以及监控摄像头数量和覆盖程度的快速增加,监控设备智能化数据处理日益成为学术界和工业界研究的热点技术之一。这其中,行人重识别技术因对于人物检索、嫌疑人搜寻等多种应用起着至关重要的作用,具有广泛的应用场景和重要的研究意义,也因此在学术界和工业界都得到了高度重视和深入研究。得益于深度学习算法的快速发展和大规模行人重识别数据集的出现,行人重识别技术在一些标准公开数据集上的测试准确率已经得到了显著提高。然而,由于不同摄像头的架设角度、背景环境,它物遮挡、光线条件、分辨率、行人姿态动作等因素影响,在具体实现该技术时面临着诸多挑战。现有技术中,行人重识别方法利用预训练好的卷积神经网络模型(如ResNet、VGG)提取输入图像特征,之后接一个全连接层和softmax分类器,把每一个行人ID视为一类,通过优化分类损失函数来训练这个模型。这些方法的基本思想是把重识别问题转换为分类问题,该 ...
【技术保护点】
1.一种行人重识别方法,其特征在于,包括如下步骤:/nS100:利用生成对抗网络,对原始训练数据集中的原始样本图片进行风格转换,扩增所述原始训练数据集,得到扩增后的训练数据集;/nS200:初始化残差网络,并利用所述扩增后的训练数据集训练所述残差网络,基于三元组损失优化所述残差网络的参数,得到行人重识别模型;/nS300:利用所述行人重识别模型,提取待识别测试集中每一张待识别行人图像的深度特征得到特征向量,计算所述特征向量之间的相似度,得到每一张所述待识别行人图像的候选行人图像列表;/n其中,所述风格转换包括,将原始样本图片转换为若干个目标域摄像装置风格下的目标域样本图片, ...
【技术特征摘要】
1.一种行人重识别方法,其特征在于,包括如下步骤:
S100:利用生成对抗网络,对原始训练数据集中的原始样本图片进行风格转换,扩增所述原始训练数据集,得到扩增后的训练数据集;
S200:初始化残差网络,并利用所述扩增后的训练数据集训练所述残差网络,基于三元组损失优化所述残差网络的参数,得到行人重识别模型;
S300:利用所述行人重识别模型,提取待识别测试集中每一张待识别行人图像的深度特征得到特征向量,计算所述特征向量之间的相似度,得到每一张所述待识别行人图像的候选行人图像列表;
其中,所述风格转换包括,将原始样本图片转换为若干个目标域摄像装置风格下的目标域样本图片,所述目标域摄像装置均为所述原始训练数据集使用的摄像装置的个数。
2.根据权利要求1所述的行人重识别方法,其特征在于,在对原始训练数据集中的原始样本图片进行风格转换之前,先对每一张所述原始样本图片预处理,所述预处理包括以下步骤,
将所述原始样本图片进行图像归一化得到大小统一的图片;
将所述原始样本图片的所属摄像装置序号作为其源域标签;
给所述原始样本图片随机生成一个目标域标签,其中,所述目标域标签为所述原始样本图片被转换为目标域摄像装置的序号。
3.根据权利要求2所述的行人重识别方法,其特征在于,在对每一张所述原始样本图片预处理之后,还包括训练所述生成对抗网络,然后再对原始训练数据集中的原始样本图片进行风格转换,其中,训练所述生成对抗网络的步骤如下,
初始化生成单元G、生成单元F、判别单元DX和判别单元DY的权值;
使用对抗损失函数,分别训练所述判别单元DX和所述判别单元DY的权值;
根据对抗损失函数和一致性稳定损失函数,分别训练所述生成单元G和所述生成单元F的权值,其中,所述一致性稳定损失函数的公式为:
其中,G,F表示生成单元操作。
4.根据权利要求3所述的行人重识别方法,其特征在于,所述风格转换的步骤如下,
将所述原始训练数据集中的每一张原始样本图片,分别经过所述生成对抗网络训练得到的所述生成单元G,产生各自所述目标域摄像装置风格下的目标域样本图片;
重复上述操作,直至将每一张所述原始样本图片都转换为其它N-1个目标域摄像装置风格下的目标域样本图片,得到所述扩增后的训练数据集;
其中,N为所述原始训练数据集的摄像装置的个数。
5.根据权利要求1所述的行人重识别方法,其特征在于,步骤S200中所述初始化残差网络,并利用所述扩增后的训练数据集训练所述残差网络,基于三元组损失优化所述残差网络的参数,得到行人重识别模型,包括以下步骤,
S210:将所述扩增后的训练数据集中的训练样本图片随机划分为若干个训练数据子集,每一个训练数据子集均包含M个行人ID的所述训练样本图片;
S220:利用ImageNet数据集作为训练数据,训练一个ResNet-50参差网络作为所述行人重识别模型的初始权值,去掉所述ResNet-50残差网络最后的第一维数全连接层,在最后一个均值池化层之后连接一个第二维数全连接层和一个第三维数全连接层,得到初始化的ResNet-50残差网络;
S230:将其中一个所述训练数据子集中的所述训练...
【专利技术属性】
技术研发人员:付宇卓,刘婷,许荣森,吉学刚,曹德明,申子正,
申请(专利权)人:上海交通大学,中通客车控股股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。