【技术实现步骤摘要】
基于自标签精炼深度学习模型的无监督行人重识别方法
[0001]本专利技术涉及行人重识别
,具体而言,涉及基于自标签精炼深度学习模型的无监督行人重识别方法。
技术介绍
[0002]行人重识别是近年来计算机视觉领域比较热门的研究方向之一,它是一个图像检索中的问题,是利用计算机视觉技术判断图像或视频中是否存在特定行人的技术,即给定一个监控行人图像检索跨设备下的该行人图片。
[0003]随着科技的发展,行人重识别技术已经被广泛应用到智能安防、视频监控等领域。目前,行人重识别已经在有标注的监督领域取得了比较大的突破,并且展现出了优越的性能。但是,由于标注数据集需要较高的人工成本,而无标签的数据往往是十分廉价而且规模比较大的。如何扩展到大型未标注的数据集和新的数据域越来越受到人们的关注,无监督行人重识别应运而生。无监督行人重识别就是利用没有标记的数据集学习行人的特征表征,然而因为缺乏对图像数据的标注,这种基于无监督学习的行人重识别方法往往很难达到有监督学习方法所能够达到的检索准确率。
[0004]目前,比较流行的完 ...
【技术保护点】
【技术特征摘要】
1.基于自标签精炼深度学习模型的无监督行人重识别方法,其特征在于,包括步骤:S1:获取不带标签的行人图片数据集其中N表示数据集中图片的数量,x
i
表示数据集中第i张行人图片,将每张图片的尺寸调整为相同高度和宽度,并进行预处理;S2:构建自标签精炼深度学习模型,将预处理的训练数据输入网络,提取图片样本的多粒度特征;其中,多粒度特征包括全局特征、上半身特征和下半身特征;S3:对提取的多粒度特征进行聚类,得到全局伪标签,上半身伪标签和下半身伪标签;S4:根据聚类结果构建记忆模块,计算一致性矩阵并修正全局伪标签;S5:通过计算总损失,梯度回传更新网络参数,动量更新记忆模块参数,保存网络的最优参数。2.根据权利要求1所述的基于自标签精炼深度学习模型的无监督行人重识别方法,其特征在于,所述预处理包括水平翻转、补零填充、标准化和随机擦除四种方式。3.根据权利要求2所述的基于自标签精炼深度学习模型的无监督行人重识别方法,其特征在于,所述自标签精炼深度学习模型由特征提取器,记忆模块和自标签精炼模块组成;所述特征提取器结构包括两部分,所述特征提取器的第一部分采用ResNet50架构的前四个阶段;所述特征提取器的第二部分在第一部分后分为两个分支,分别为全局分支和局部分支,对所述全局分支得到的特征图采用Generalize
‑
mean Pooling进行池化,其中参数p=2,池化后特征图大小为2048
×1×
1;对所述局部分支得到的特征图采用Generalize
‑
mean Pooling池化,参数p=2,池化后的特征图大小为2048
×2×
1,并对特征图进行水平条划分,得到两个大小均为2048
×1×
1的局部特征图;对所述局部分支得到的特征图通道进行缩减,采用256个1
×
1的卷积核对两个2048
×1×
1的局部特征图分别进行卷积,对得到结果进行Batch Normalize和ReLU,所述局部分支得到两个局部特征图大小为256
×1×
1和256
×1×
1;对所述全局分支和所述局部分支得到的特征图进行维度剪裁,得到一个维度为2048
×
1的全局特征和两个256
×
1的局部特征。4.根据权利要求3所述的基于自标签精炼深度学习模型的无监督行人重识别方法,其特征在于,所述ResNet50架构包括五个阶段,分别为:第一阶段:卷积操作的卷积核数目为64,卷积核大小为7
×
7,补零参数的值为3,步长为2;Batch Normalize和ReLU激活;最大池化操作的核大小为3
×
3,补零参数值为1,步长为2;第二个阶段包括三个Bottleneck;第三个阶段包括四个Bottleneck;第四个阶段包括六个Bottleneck第五个阶段包括三个Bottleneck。5.根据权利要求4所述的基于自标签精炼深度学习模型的无监督行人重识别方法,其特征在于,所述全局分支的结构和所述ResNet50架构的第五个阶段相同,包括三个Bottlene...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。