一种基于注意力机制与空间几何约束的行人重识别方法技术

技术编号:28498910 阅读:156 留言:0更新日期:2021-05-19 22:38
本发明专利技术属于计算机视觉领域,特别涉及一种基于注意力机制与空间几何约束的行人重识别方法,包括如下步骤:S1、获取行人图像并输入到上位机中;S2、建立和训练行人重识别模型,行人重识别模型包括ResNet50+SEnet网络和特征处理模块,特征处理模块包括全局特征分支和局部特征分支;S3、行人重识别并输出结果。本发明专利技术分析并设计了一种ResNet50网络与SEnet注意力机制分组结合的行人身份重识别网络,通过优化SEnet注意力机制的作用位置,深度挖掘行人身份的显著性特征,有效提高了行人身份重识别网络的判别能力。络的判别能力。络的判别能力。

【技术实现步骤摘要】
一种基于注意力机制与空间几何约束的行人重识别方法


[0001]本专利技术属于计算机视觉领域,特别涉及一种基于注意力机制与空间几何约束的行人重识别方法。

技术介绍

[0002]行人重识别(Person re

identification)也称行人再识别,指在多个摄像头中,给定一张某摄像头拍摄的待识别行人图像,在不同的摄像头中检索出与待识别行人具有相同身份的行人图像。随着人工智能技术的发展,计算机视觉已广泛应用于诸如智能家居,视频监控和智能交通等人类日常生活中,行人重识别是这些领域的关键问题之一。在行人重识别任务中,通常伴随着相机角度、场景变化、行人姿态变化等问题,从而影响行人重识别的准确率。
[0003]早期的行人重识别方法主要是一些基于手工构造的特征和距离度量,手工构造的特征是人为设计出一些具有较强鲁棒性的特征提取方法用来获取行人的外观特征,距离度量是运用或设计距离计算方法,使得不同身份行人图像之间的距离尽可能远,相同身份行人图像之间的距离尽可能近,但是这些方法难以满足如今行人重识别对准确率的高要求。随着深度学习的迅本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制与空间几何约束的行人重识别方法,其特征在于:包括如下步骤:S1、获取行人图像并输入到上位机中;S2、建立和训练行人重识别模型,行人重识别模型包括ResNet50+SEnet网络和特征处理模块,特征处理模块包括全局特征分支和局部特征分支;S3、行人重识别并输出结果:S3.1、在行人图像中指定目标行人图像,然后将行人图像,包括指定的目标行人图像,输入到行人重识别模型;S3.2、通过ResNet50+SEnet网络提取行人图像的空间特征,将空间特征输入特征处理模块;S3.3、空间特征通过全局特征分支得到256维全局特征,同时空间特征通过局部特征分支得到15个256维局部特征,然后将256维全局特征和15个256维局部特征相互融合计算得到目标行人的身份特征和各行人图像对应的行人身份特征;S3.4、计算目标行人的身份特征与各行人图像对应的行人身份特征的欧氏距离,并从低到高排序,排序过程中去除与目标行人图像同一相机拍摄的行人图像的计算结果,将排序结果作为行人重识别结果并在上位机中输出。2.根据权利要求1所述的一种基于注意力机制与空间几何约束的行人重识别方法,其特征在于,S2包括以下步骤:S2.1、所述建立行人重识别模型包括建立行人重识别模型和训练使用的行人重识别模型,训练使用的行人重识别模型包括ResNet50+SEnet网络和训练使用的特征处理模块:S2.1.1、建立ResNet50+SEnet网络输入的行人图像先经过第1组卷积,然后经过4组卷积+注意力模块的组合输出行人的空间特征;5组卷积均为残差卷积神经网络ResNet50的卷积,第1组卷积有1个卷积层且不含残差结构,后4组卷积+注意力模块的组合中的卷积分别有9、12、18、9个卷积层及对应的残差结构;注意力模块为注意力机制SEnet,计算过程如下:s1=GAP(F),s2=ReLU(W1s1),s3=Sigmoid(W2s2),F'=s2·
F,其中表示输入的大小为C
×
H
×
W的特征图,GAP表示全局平均池化,表示全局平均池化后的输出,表示全连接层FC1的参数,表示经过FC1和ReLU函数处理后的输出,表示全连接层FC2的参数,表示经过FC2和Sigmoid函数处理后的输出的通道权重,表示注意力机制SEnet的输出;S2.1.2、建立特征处理模块所述全局特征分支计算过程如下:f
g
'=GAP(f
g
)
其中f
g
表示空间特征,大小为2048
×
24
×
12,GAP表示全局平均池化,f
g
'表示全局特征,大小为2048维,表示全连接层FC1的参数,表示经过全连接层FC1压缩后的256维全局特征;所述局部特征分支计算过程如下:f
i
'=GAP(f
i
)i=1,2,3,4,5,6f
lk
=c(f
i
',f
j
')k=1,2,...,14,15,i<j,j=2,3,4,5,6其中f
i
表示空间特征分解后的6个子特征块,大小为2048
×4×
12,GAP表示全局平均池化,f
i

表示6个子特征块经过平均池化后输出的子空间特征,大小为2048维,c表示组合操作,f
lk
表示局部特征,大小为4096维,表示全连接层FC1的参数,表示经过全连接层FC1压缩后的15个...

【专利技术属性】
技术研发人员:马淼王云涛潘海鹏
申请(专利权)人:浙江理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1