【技术实现步骤摘要】
基于层次聚类与困难样本三元组的无监督行人重识别方法
[0001]本专利技术涉及无监督行人重识别
,尤其是涉及基于层次聚类与困难样本三元组的无监督行人重识别方法。
技术介绍
[0002]随着城市人口的不断增长,社会公共安全问题越来越受到人们的重视,当前在许多公共场所都覆盖有大规模的网络摄像头,是监控安防的重要保障。为了提升网络摄像头的安防智能水平,行人重识别技术是如今视觉分析领域的研究热点,得到了学术界的广泛重视。行人重识别目的是在非重叠视角域多摄像头网络下进行的行人匹配,即确认不同位置的摄像头在不同的时刻拍摄到的行人目标是否为同一人。
[0003]行人重识别问题可以转化为计算样本的相似度或者距离,然后根据所计算的相似度或距离对样本进行排序,进而找到与查询样本属于同一个人的图像。然而,行人重识别的研究面临着诸如图像分辨率低、视角变化、姿态变化、光线变化以及遮挡等带来的诸多挑战。当前行人重识别方法主要通过基于特定场景下大量带标签的视频图像数据训练一个稳定可靠的模型,这类监督学习方法忽略了在实际应用中模型对新场景的适应性,并且需要大量的手工标注数据,而手工标注工作是昂贵的,不适用大规模的真实世界的数据集。因此发展无监督行人重识别技术具有重要应用价值。Fan等人提出采用k
‑
means聚类和CNN模型迭代训练预测无标签行人图像的伪标签并学习判别性特征。对于复杂的行人图像,原始的特征空间具有高度的非线性和不可分性,聚类效果不太理想。Zheng等人提出一种渐进式无监督学习的方法,先在有标签的数据集 ...
【技术保护点】
【技术特征摘要】
1.一种基于层次聚类与困难样本三元组的无监督行人重识别方法,其特征在于,包括以下步骤:1)将待处理的行人图像集合划分为训练集和测试集;2)为所述训练集中的每个图像分配初始化的标签,设置训练阶段号的初始值为1;3)将所述训练集的所有图像及其标签输入预先建立的CNN模型中,提取行人特征,进行模型训练;4)对所述提取出的行人特征的特征集合进行从底向上的层次聚类,将相似的图像分配到同一簇中,根据簇分配结果,对图像的标签进行更新;5)对步骤4)得到的簇类别进行抽样,重组得到新的训练集;6)根据困难样本三元组损失函数,对步骤5)中重组得到新的训练集进行微调;7)计算步骤6)得到的所述训练集的平均轮廓系数;8)将步骤3)至7)作为一个训练阶段,计算当前训练阶段与上一时刻训练阶段中所述平均轮廓系数的差值,若该差值大于预设的差值变化阈值,则采用步骤7)得到的训练集返回步骤3),并将所述训练阶段号的数值加一;若该差值小于所述差值变化阈值,则以此时的训练集的聚类簇数为横坐标、以平均轮廓系数为纵坐标,绘制评估系数曲线图,并将该评估系数曲线图中曲线拐点对应的聚类簇数作为最佳聚类簇数、将采用该最佳聚类簇数的训练集训练得到的CNN模型作为最佳CNN模型;9)将所述测试集载入所述最佳CNN模型中提取行人特征,并计算该行人特征与所述训练集对应的行人特征之间的距离,获取所述训练集中距离最小的行人图像对应的标签作为行人重识别结果。2.根据权利要求1所述的一种基于层次聚类与困难样本三元组的无监督行人重识别方法,其特征在于,所述CNN模型的建立过程包括获取预训练后的ResNet50模型,将该ResNet50模型中最后一层的分类层替换为一个全连接层,该全连接层的输出维度为当前训练阶段中训练集中的簇数目。3.根据权利要求1所述的一种基于层次聚类与困难样本三元组的无监督行人重识别方法,其特征在于,所述CNN模型的目标函数为log对数损失函数,该log对数损失函数的计算表达式为:表达式为:式中,表示预测图像x
i
属于簇的概率,V
j
表示第j个簇的聚类中心,其取值为第j个簇中所有行人特征的均值,表示第个簇的聚类中心,C
k
表示当前第k阶段的簇数目,C1=N,α∈(0,1)为平衡各个类别概率分布的参数,υ表示将特征归一化,按照计算得到;进行反向传播时,按照更新图像x
i
所在的簇的聚类中心的特征;用最小
化目标函数对CNN模型进行训练,直到收敛为止。4.根据权利要求1所述的一种基于层次聚类与困难样本三元组的无监督行人重识别方法,其特征在于,步骤4)中,所述层次聚类具体为:根据单个图像初始化簇,按照两个簇之间的相似度由大到小合并成新的簇,直到簇的数量不在变化为止;所述两个簇之间的相似度的计算表达式为:式中,为C
a<...
【专利技术属性】
技术研发人员:王福银,韩华,王春媛,黄丽,
申请(专利权)人:上海工程技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。