【技术实现步骤摘要】
基于部位感知建模的遮挡场景下的行人重识别方法
本专利技术涉及计算机视觉
,具体涉及一种基于部位感知建模的遮挡场景下的行人重识别方法。
技术介绍
行人重识别是一项跨摄像头跨场景下搜寻与匹配目标行人的技术。行人重识别技术可以与行人检测、行人跟踪技术相结合,在视频监控、智能安防、刑事侦查等方面有着广泛应用。传统的行人重识别方法大多假设行人图像包含了目标行人的整个身体。然而在现实场景中(例如商场、地铁站)进行行人重识别时,行人的遮挡问题是不可避免的。因此,设计有效的模型去解决遮挡场景下的行人重识别问题是十分必要的。目前的遮挡场景下的行人重识别方法可以归为三类。基于手工分块的方法直接将行人特征进行水平分块,将每一块的特征作为行人某个部位的特征。但是这样的手工分块比较粗略,容易受到背景遮挡的影响。基于额外语义模型的方法,往往会使用一个预训练好的人体分割模型或者姿态估计模型去得到行人部位的信息。然而,由于不同任务的训练集之间存在差别,这些模型在行人重识别数据集中的表现不够稳定,很容易引入背景噪声。基于注意力机制的方法 ...
【技术保护点】
1.一种基于部位感知建模的行人重识别方法,其特征在于,包括以下步骤:/n获取行人图像;/n对所述行人图像进行特征提取和降维;/n将处理后的图像特征输入到基于图片上下文信息的Transformer编码器,经过第一处理后得到图像全局特征的行人特征;/n将非全局特征的行人特征输入基于行人部位原型的Transformer解码器,经过第二处理后得到行人部位特征;/n将所述行人部位特征与所述全局特征的行人特征连接在一起作为最终的行人特征表示,进行行人图像的检索与匹配,实现行人重识别。/n
【技术特征摘要】
1.一种基于部位感知建模的行人重识别方法,其特征在于,包括以下步骤:
获取行人图像;
对所述行人图像进行特征提取和降维;
将处理后的图像特征输入到基于图片上下文信息的Transformer编码器,经过第一处理后得到图像全局特征的行人特征;
将非全局特征的行人特征输入基于行人部位原型的Transformer解码器,经过第二处理后得到行人部位特征;
将所述行人部位特征与所述全局特征的行人特征连接在一起作为最终的行人特征表示,进行行人图像的检索与匹配,实现行人重识别。
2.根据权利要求1所述的行人重识别方法,其特征在于,所述获取行人图像是在遮挡场景下进行的。
3.根据权利要求1所述的行人重识别方法,其特征在于,所述特征提取是通过ResNet-50网络实现的。
4.根据权利要求1所述的行人重识别方法,其特征在于,所述降维是通过1×1的卷积实现的。
5.根据权利要求1所述的行人重识别方法,其特征在于,所述第一处理包括:
根据降维后的图像特征F=[f1;f2;...;fhw],使用全连接层将空间特征fi、fj映射到不同嵌入空间,得到Qi、Kj、Vj;
计算Qi、Kj之间的相似度βi,j,对βi,j进行归一化得到归一化的自注意力权重si,j;
使用自注意力权重si,j对Vj进行空间位置上的加权求和,得到更新的空间特征对所有空间位置进行上述操作得到
将通过一个两层全连接层的神经网络FFN,得到最终的输出图像特征Fatt,并对Fatt进行全局平局池化得到全...
【专利技术属性】
技术研发人员:张天柱,张勇东,李昱霖,吴枫,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。