一种基于特征解耦学习的半监督行人重识别方法技术

技术编号：27254226 阅读：28 留言：0更新日期：2021-02-04 12:32

本发明专利技术公开了一种基于特征解耦学习的半监督行人重识别方法，没有遵循伪标签和聚类等方法，而是构建了一个不依赖标签的变分自编码器的特征解耦行人重识别模型，具体首先设计一个具有共享模块和参数的双流自编码器的结构。对于编码器模块，本发明专利技术将行人图像及其水平翻转图像作为一对输入，并对深度特征进行编码，正确识别身份和结构信息。然后，对于解耦特征即身份特征、结构特征不同组合级联后的特征用于在解码器中重构图像。本发明专利技术提升了半监督的精度。此外，通过与其他的方法的训练收敛性对比实验，证明本发明专利技术提出的方法的有效性，可以在更少的迭代次数就收敛到更好的效果。在更少的迭代次数就收敛到更好的效果。在更少的迭代次数就收敛到更好的效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于特征解耦学习的半监督行人重识别方法

[0001]本专利技术属于计算机视觉、机器学习等
，更为具体地讲，涉及一种基于特征解耦学习的半监督行人重识别方法。

技术介绍

[0002]行人重识别问题是计算机视觉领域一个重要的研究问题。行人重识别技术结合了模式识别、机器学习、计算机视觉、图像处理以及计算机应用等多个学科，构成了一种在连续视频帧中获取目标位置的手段，为后续的高层识别应用比如行人行为分析奠定了基础。
[0003]目前，行人重识别技术广泛应用于智能监控、智能交通、行为分析、人机交互、智能驾驶系统等领域中，有着广泛的应用前景及巨大的潜在经济价值。行人重识别技术还被广泛应用在刑侦、人流分析、人流预测等多个领域，并且随着智慧城市建设的推进，行人重识别技术会解决更多贴近我们生活的实际问题。所以，对行人重识别问题的研究并对其在实际环境下性能改进具有巨大的现实意义和长远的价值。
[0004]在行人重识别
，学者已经提出了很多方法。这些方法主要重点关注了三个部分：手工描述符设计、度量学习和深度行人重识别模型。手工描述符目的是对不同视角、姿势和光照度等提取鲁棒性的特征。度量学习的目的是学习一个特征投影空间，其中同一行人的相似度会大于不同人。随着深度卷积神经网络(CNN)成功应用，深度行人重识别模型能够在一个端到端的网络框架中直接学习强大和有辨别力的特征，这种方式也得到了越来越多的关注。
[0005]根据是否使用行人身份标注，深度行人重识别模型大致可以分为有监督学习和无监督学习两种。前者借助标...

【技术保护点】

【技术特征摘要】
1.一种基于特征解耦学习的半监督行人重识别方法，其特征在于，包括以下步骤：(1)、构建一个半监督的行人重识别模型基于一个身份编码器E
id
、一个结构编码器E
struct
以及一个解码器D构建一个特征解耦网络，并作为半监督的行人重识别模型；(2)、训练半监督的行人重识别模型2.1)、计算监督训练损失L
S
：2.1.1)、将有标签Y的行人图像I
O
输入到半监督的行人重识别模型中，一方面直接分别通过身份编码器E
id
、结构编码器E
struct
进行编码，得到身份特征结构特征另一方面将行人图像I
O
水平翻转，生成水平翻转图像I
T
，然后，水平翻转图像I
T
，分别通过身份编码器E
id
、结构编码器E
struct
进行编码，得到身份特征结构特征2.1.2)、身份特征通过GAP&FC操作得到身份特征向量身份特征通过另一GAP&FC操作得到身份特征向量(GAP，Global Average Pooling，即全局平均池化，FC，Fully connecting，即全连接)；将身份特征向量进行分类操作，得到属于标签Y的预测概率，进而根据预测概率计算出标签一致性损失将身份特征向量进行另一分类操作，得到属于标签Y的预测概率，进而根据预测概率计算出标签一致性损失2.1.3)、将身份特征结构特征级联，然后通过解码器D解码，得到重构图像将身份特征结构特征级联，然后通过解码器D解码，得到重构图像将身份特征结构特征级联，然后通过解码器D解码，得到重构图像将身份特征结构特征级联，然后通过解码器D解码，得到重构图像计算自身图像重构损失计算自身图像重构损失其中：|| ||2表示L2范数；计算交换图像重构损失计算交换图像重构损失其中：这样得到图像重构损失L
rec
：2.1.4)、计算身份不变性约束损失L
inv
以及结构等变性约束损失L
equ
：
其中，D
KL
(*||*)是表示计算两个特征的Kullback-Leibler散度距离，T(*)表示对特征进行水平翻转变换这样得到解耦特征的一致性损失L
ct
：L
ct
＝L
inv
+L
equ
2.1.5)、根据步骤2.1.2)-2.1.4)，得到监督训练损失L
S
：其中，权重系数α、权重系数β可以根据经验进行设定；2.2)、计算无监督训练损失L
U
：2.2.1)、将无标签的行人图像I
′
O
输入到半监督的行人重识别模型中，一方面直接分别通过身份编码器E
id
、结构编码器E
struct
进行编码，得到身份特征结构特征另一方面将行人图像I
′
O
水平翻转，生成水平翻转图像I
′
T
，然后，水平翻转图像I
′
T
...

【专利技术属性】
技术研发人员：周雪，郝戈寒，陈光箭，邹见效，徐红兵，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人