一种基于迁移学习的无监督行人重识别方法技术

技术编号：21892889 阅读：36 留言：0更新日期：2019-08-17 14:53

本发明专利技术公开了一种基于迁移学习的无监督行人重识别方法，包括如下步骤：1)在带标签的源数据集上预训练CNN模型，采用交叉熵损失和三元度量损失作为目标优化函数；2)提取无标签的目标数据集行人特征；3)结合候选列距离和绝对距离计算特征相似度矩阵；4)对相似度矩阵进行密度聚类，为每个距离小于预设阈值的特征集合设置一个标签，重组成带标签的目标数据集；5)在重组数据集上训练CNN模型至收敛；6)以预设迭代次数重复步骤2)‑5)；7)将测试图片输入模型提取特征，根据特征相似度进行排序得到结果。本发明专利技术合理运用源领域有标签数据和目标领域无标签数据，在目标领域上提高行人重识别的准确率，降低对有标签数据的强依赖性。

An unsupervised pedestrian recognition method based on Transfer Learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于迁移学习的无监督行人重识别方法
本专利技术涉及人工智能及安防监控领域，具体涉及一种基于迁移学习的无监督行人重识别方法。
技术介绍
随着城市人口的不断增长，社会公共安全问题越来越受到人们的重视，当前在许多公共场所都覆盖有大规模的摄像头网络，为监控安防提供了重要的设施基础。为了增强摄像头网络的安防水平质量，行人重识别技术在人员搜寻上也得到了广泛的关注。当前行人重识别方法主要通过基于特定场景下大量带标签的视频图像数据训练一个稳定可靠的模型，这类监督学习方法忽略了在实际应用中系统对新场景的适应性，并且依赖于大量带标签的行人数据，而标签工作往往需要耗费大量的人力和物力，不利于系统的部署。此外由于行人图像都存在光照变化，视角姿势变化与遮挡等诸多挑战，仅仅利用无标签的数据进行无监督学习也难以达到令人满意的性能。近年来，随着迁移学习研究的深入和发展，通过迁移带标签的源数据集的已有知识解决无标签的目标数据集的学习问题，实现了较高的识别准确率。但当前迁移学习主要解决不同数据域存在共同类别的问题，行人重识别在不同场景往往不存在相同的行人，故难以直接应用于解决行人重识别问题。因此如何利用旧场景的带标签行人数据以及新场景下的无标签行人数据进行迁移学习实现在新场景下的高识别准确率是目前亟待解决的问题。
技术实现思路
本专利技术的目的是为了解决现有技术中的上述缺陷，提供一种基于迁移学习的无监督行人重识别方法。本专利技术的目的可以通过采取如下技术方案达到：一种基于迁移学习的无监督行人重识别方法，所述的无监督行人重识别方法包括如下步骤：S1、在带标签的源数据集上预训练CNN模型，采用交...

【技术保护点】
1.一种基于迁移学习的无监督行人重识别方法，其特征在于，所述的无监督行人重识别方法包括如下步骤：S1、在带标签的源数据集上预训练CNN模型，采用交叉熵损失和三元度量损失作为目标优化函数，训练CNN模型至收敛；S2、采用预训练的CNN模型提取无标签的目标数据集的行人特征；S3、结合候选列距离和绝对距离计算行人的特征相似度矩阵；S4、对相似度矩阵进行密度聚类，输出距离小于预设阈值的特征集合，每个特征集合设置为一个标签，重组成带标签的目标数据集；S5、在带标签的目标数据集上训练CNN模型至模型收敛；S6、以预设迭代次数重复步骤S2‑S5；S7、将目标测试集图片输入训练好的CNN模型提取特征，根据特征相似度进行排序得到行人重识别结果，进而实现无监督的行人重识别方法。

【技术特征摘要】
1.一种基于迁移学习的无监督行人重识别方法，其特征在于，所述的无监督行人重识别方法包括如下步骤：S1、在带标签的源数据集上预训练CNN模型，采用交叉熵损失和三元度量损失作为目标优化函数，训练CNN模型至收敛；S2、采用预训练的CNN模型提取无标签的目标数据集的行人特征；S3、结合候选列距离和绝对距离计算行人的特征相似度矩阵；S4、对相似度矩阵进行密度聚类，输出距离小于预设阈值的特征集合，每个特征集合设置为一个标签，重组成带标签的目标数据集；S5、在带标签的目标数据集上训练CNN模型至模型收敛；S6、以预设迭代次数重复步骤S2-S5；S7、将目标测试集图片输入训练好的CNN模型提取特征，根据特征相似度进行排序得到行人重识别结果，进而实现无监督的行人重识别方法。2.根据权利要求1所述的一种基于迁移学习的无监督行人重识别方法，其特征在于，所述的步骤S1包括：S1.1、选定CNN模型为Resnet模型，在Resnet模型的分类器前增加一层全连接层，修改分类器的类别数目为源数据集中行人的身份个数；S1.2、带标签的源数据集Ns为源数据集图片总数，输入到Resnet模型进行前向传播输出行人特征；S1.3、记模型输入的锚点样本为正样本为负样本为记f(I)为网络全局池化层的输出特征，三元度量损失和交叉熵损失分别表示为：其中θ为模型的参数，m为模型收敛时负样本对之间距离与正样本对之间距离的目标差值，pi为输入图像经过模型分类后的概率值，将目标优化函数表示为：Ltotal(θ)＝Ltri(θ)+Lentropy(θ)通过最小化目标函数Ltotal(θ)，迭代...

【专利技术属性】
技术研发人员：周智恒，陈增群，李波，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人