一种行人重识别方法技术

技术编号：33326527 阅读：5 留言：0更新日期：2022-05-08 09:05

本发明专利技术涉及一种行人重识别方法，属于图像识别处理技术领域。本发明专利技术提出属性引导的注意力，为每个属性提供属性相关的注意力引导，通过利用与行人属性个数相同的卷积核对高层特征图进行特征提取，得到每个属性的特征图，从而提升属性特征向量的语义表示效果。然后根据每个属性的特征向量建立属性间的依赖关系，通过这种依赖关系用一个属性的识别精度辅助另一个属性的识别，整体提升属性识别精度。整体提升属性识别精度。整体提升属性识别精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种行人重识别方法

[0001]本专利技术涉及一种行人重识别方法，属于图像识别处理

技术介绍

[0002]行人重识别是研究在非重叠视角下跨摄像头的特定行人追踪，这种方法可以使用大量的在线互联的多摄像头，实现特定行人的跨域追踪，用于事件发现、嫌疑人追踪、行为分析等，是一种基于云端的视频信息分析技术，可以为日常生活提供安全保障。
[0003]现实场景中，行人身份识别的准确性受到许多因素的干扰，例如环境因素、行人自身因素等，这些对于行人重识别有不同的影响。由于环境因素的变化复杂多样，因此寻找适应不同环境的模型具有一定困难。而行人自身因素，例如性别、发长、衣服颜色、着装类型等属性特征，在一定时期内具有不变性，对于追踪特定行人非常有效。因此，行人属性识别是行人重识别、行人分析的一种常用方式，是一种细粒度的行人分析方法，在智能视频监控领域拥有广泛的应用前景。行人属性特征作为一种局部特征，在行人重识别中可结合行人ID信息使用，能够提高行人重识别的精度。
[0004]但现有的方法中，在属性学习研究中，注意力机制采用的是统一的特征分布，并不针对每个属性应用不同的注意力。换句话说，所有的属性对应的特征空间是相同的，位于特征空间中的向量直接投影到各属性分类分支，得到该属性的置信度得分。这个特征空间并不是针对各个属性的，而是针对整个行人图像的，因此不具有属性类的特点。对于特定区域的属性表示上，行人属性特征并没有得到较好的利用，同时对行人属性之间存在的依赖关系考虑不足，导致识别精度比较低。

技术实现思路
/>[0005]本专利技术的目的是提供一种行人重识别方法，以解决目前行人重识别由于未考虑属性间依赖关系导致识别精度低的问题。
[0006]本专利技术为解决上述技术问题而提供该识别方法包括以下步骤：
[0007]1)对获取的图像进行特征识别，得到图像的高层特征图；
[0008]2)利用与行人属性个数相同的卷积核对高层特征图进行特征提取，得到每个属性的特征图；
[0009]3)根据各属性的特征图对每个属性对应的特征向量进行依赖关系的建立；
[0010]4)利用各属性对应特征向量间的依赖关系对待识别图像的进行识别。
[0011]本专利技术提出属性引导的注意力，为每个属性提供属性相关的注意力引导，通过利用与行人属性个数相同的卷积核对高层特征图进行特征提取，得到每个属性的特征图，从而提升属性特征向量的语义表示效果。然后根据每个属性的特征向量建立属性间的依赖关系，通过这种依赖关系用一个属性的识别精度辅助另一个属性的识别，整体提升属性识别精度。
[0012]进一步地，为准确得到图像的高层特征，所述步骤1)采用预训练的去掉最后的池
化层和全连接层的卷积神经网络进行特征识别。
[0013]进一步地，所述步骤2)中的卷积核的尺寸为3*3。
[0014]进一步地，为准确建立各属性对应特征向量间的依赖关系，所述步骤3)采用LSTM网络建立每个属性对应的特征向量进行依赖关系，该LSTM网络包括正向LSTM层和反向LSTM层，假设行人属性有L个，正向LSTM层和反向LSTM层均包括有L个LSTM单元，每个属性特征均分别输入到正向LSTM层和反向LSTM层中对应的LSTM单元中。
[0015]进一步地，所述的卷积神经网络采用去掉最后的全局平均池化层和全连接层的ResNet-50。
[0016]进一步地，为保证模型训练的精度，所述步骤4)在识别过程中采用属性分类和行人ID分类的损失之和进行训练。
[0017]进一步地，属性分类损失采用的交叉熵损失函数为：
[0018][0019]其中，p(y
i,j
)表示第i类属性的第j个值的预测概率，q(y
i,j
)表示第i类属性的第j个值的真实概率。
[0020]进一步地，行人ID分类损失采用的交叉熵损失函数为：
[0021][0022]其中，p(y
k
)表示第k个ID类别的预测概率，q(k)表示第k个ID类别的真实概率。
附图说明
[0023]图1是本专利技术行人重识别方法所采用的网络结构示意图；
[0024]图2-a是本专利技术卷积特征提取模块所采用的ResNet-50的网络结构示意图；
[0025]图2-b是本专利技术所采用的ResNet-50结构中Conv Block的结构示意图；
[0026]图2-c是是本专利技术所采用的ResNet-50结构中Identity Block的结构示意图；
[0027]图3是本专利技术属性引导的注意力模块的网络结构示意图；
[0028]图4是本专利技术中单个LSTM单元对属性特征向量的计算过程示意图。
具体实施方式
[0029]下面结合附图对本专利技术的具体实施方式作进一步地说明。
[0030]本专利技术的行人重识别方法从行人属性特征的细粒度定位和属性依赖关系建模的角度出发，通过引入属性引导的注意力机制，以学习针对各个行人属性的判别式特征；对各个行人属性之间的依赖关系进行显示的建模，充分利用行人属性共现关系以提升行人属性识别精度；同时采用端到端的训练方式进行网络训练。
[0031]如图1所示，本专利技术的行人重识别方法所采用网络结构包括卷积特征提取模块、属性引导的注意力模块和属性依赖学习模块，其中卷积特征提取模块用于对输入图像进行特征提取，得到高层特征图；属性引导的注意力模块用于提供与行人属性类别相关的自适应注意力机制；属性依赖学习模块用于各行人属性之间的关系建模。
[0032]具体而言，本专利技术的卷积特征提取模块采用预训练的CNN，去掉CNN最后的全连接
层，利用去掉最后全连接层的CNN对输入图像进行特征提取，得到最高层特征图。其中CNN的结构可以是任意的，例如AlexNet，VGGNet-16，ResNet-50等。本实施例中的CNN使用ResNet-50，其结构如图2-a所示。其中，第1个卷积层Conv,64@7
×
7表示该层含有64个尺寸为7*7的卷积核，则卷积结果输出为64通道。第2层MPool,64@3
×
3表示对通道使用最大值池化(Max Pooling)，池化窗口尺寸为3*3。随后，Conv Block和Identity Block表示残差网络中特别设计的残差模块，其具体结构如图2-b和图2-c所示。Identity Block会连续重复使用，
×
2表示该层重复2次。由于这里只为了获取最高层特征图，因此去掉了残差网络最后的全局平均池化层和全连接层。
[0033]行人重识别问题与其它的分类问题不同。一般的分类问题中，训练集和测试集的类别编号是一样的，例如训练集分类是0-9个类别，测试集也是0-9个类别。而行人重识别中，以Market-1501为例，该数据集一共含有1501个类别的行人ID，训练集含有其中的751种，而测试集含有的是另外750种，因此训练集和测试集的类别编号是不重叠的，这一本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种行人重识别方法，其特征在于，该识别方法包括以下步骤：1)对获取的图像进行特征识别，得到图像的高层特征图；2)利用与行人属性个数相同的卷积核对高层特征图进行特征提取，得到每个属性的特征图；3)根据各属性的特征图对每个属性对应的特征向量进行依赖关系的建立；4)利用各属性对应特征向量间的依赖关系对待识别图像的进行识别。2.根据权利要求1所述的行人重识别方法，其特征在于，所述步骤1)采用预训练的去掉最后的池化层和全连接层的卷积神经网络进行特征识别。3.根据权利要求1所述的行人重识别方法，其特征在于，所述步骤2)中的卷积核的尺寸为3*3。4.根据权利要求1所述的行人重识别方法，其特征在于，所述步骤3)采用LSTM网络建立每个属性对应的特征向量进行依赖关系，该LSTM网络包括正向LSTM层和反向LSTM层，假设行人属性有L个，正向LSTM层和反向LSTM层均包括有L个LSTM单元，每个属性特征均分...

【专利技术属性】
技术研发人员：常禾雨，李亚飞，司念文，张洁，王坤，高毫林，汪淼，刘盈泽，
申请(专利权)人：郑州信大先进技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人