基于样本过滤与伪标签精炼的无监督行人重识别方法技术

技术编号:33086096 阅读:27 留言:0更新日期:2022-04-15 10:49
本公开提供了一种无监督行人重识别模型的建立方法,包括:使用图像样本数据集在源域上进行训练,获得源域模型;在目标域创建协作网络与联合网络,将源域模型的模型参数迁移至目标域,对协作网络及联合网络进行初始化;将图像样本数据集分别输入至第一临时平均模型和第二临时平均模型,获得两组图像样本,分别提取样本特征,获取两组图像样本的样本特征的平均样本特征;对图像样本数据集进行聚类处理,获得聚类中心和伪标签;对图像样本数据集进行图像样本数据集分割处理,分割为信赖集和噪声集;对联合网络以及协作网络进行交替训练,获得训练后的无监督行人重识别模型。本公开还提供了一种无监督行人重识别方法、电子设备及可读存储介质。备及可读存储介质。备及可读存储介质。

【技术实现步骤摘要】
基于样本过滤与伪标签精炼的无监督行人重识别方法


[0001]本公开涉及行人重识别
,本公开尤其涉及一种无监督行人重识别模型的建立方法、无监督行人重识别方法、电子设备及存储介质。

技术介绍

[0002]随着深度学习的发展,神经网络技术被应用在越来越多的领域。行人重识别作为计算机视觉方面的重要分支,也越来越受到重视。从大的研究方向上讲,行人重识别的研究方法可以分为有监督的方法和无监督的方法。有监督的研究方法即采用有标记的数据训练网络,可以有效的提升识别的准确度,有监督的行人重识别方法可以根据标记信息有效的提取判别力较强的特征。然而随着数据量的增大,数据标记工作变得工作量巨大,不利于行人重识别方法实际应用。为此研究者们对无监督行人重识别方法进行大量研究。无监督行人重识别方法从大的研究方向上可以划分出基于聚类伪标签和基于软标签的方法。
[0003]基于聚类的研究方法通常会根据从图像中提取的特征进行聚类操作,并根据聚类结果为图像添加伪标签。LinY等人提出一种自底向上的聚类方法,该方法首先将每张图片视为个体,最大化类的多样性。之后通过聚类方法逐步将相似样本划归成同一身份,增加了每个身份内部的相似性。但该方法没有考虑跨相机的差异,无法准确匹配同一个人跨相机的身份标签。在缺乏标记的场景下,迭代聚类和标注伪标签是常用的方法。然而聚类的误差易导致错误的伪标签和训练损失。为此研究者们提出基于软标签的方法,该方法以相似度为依据计算目标图片中的行人属于某身份的概率,并以此作为图片的软标签,避免错误伪标签带来的损失。YuH提出了软多标签学习方法,将无标签的目标图片与辅助域中的数据进行比较,选择相似的图片作为已知参考人得出参考代理,然后根据图片与代理的相似度为每个无标签目标标记软多标记。
[0004]尽管基于聚类的方法被研究者证明是提升行人重识别识别率的有效方法,但是聚类过程中不可避免的会差生有噪声的伪标签,这些伪标签阻止模型性能的进一步提高。为此Yang等人根据聚类后样本与聚类中心间的距离将距离聚类中心较远的数据直接舍弃,保证了训练模数据的清洁性。在训练阶段,他们的方法中仅仅使用了三元组损失函数来优化网络,尽管有一定的促进作用,但相对于最先进的无监督方法仍有些差距。Ge等人采用基于聚类方法进行实验,他们在处理聚类中噪声数据时未做处理,将所有样本直接参与训练。在该方法中,他们提出了在线精炼软伪标签的方法;即在一个训练过程中通过一个模型输出的某张图片属于某个类的概率作为软伪标签,将软伪标签引入到交叉熵损失函数中,形成软化交叉熵损失函数来训练模型。但该方法未对参与训练的噪声样本做处理,噪声样本的存在必然会阻碍模型识别效果的提高。在上述的方法中将距离样本中心较远的样本直接舍弃会损失样本中包含的有价值信息;对样本不做处理会引入更多噪声,如何处理噪声样本是基于聚类的无监督行人重识别方法面临的问题。

技术实现思路

[0005]为了解决上述技术问题中的至少一个,本公开提供了一种无监督行人重识别模型的建立方法、无监督行人重识别方法、电子设备及存储介质。
[0006]本公开首先通过样本特征聚类,根据样本特征和聚类中心的距离把样本集分成信赖集和噪声集。然后将噪声集样本输入到协作网络中,协作网络的主要作用是挑选出噪声集中损失值较小的样本,起到样本过滤的作用。最后将损失值较小的样本与信赖集样本组成混合输入,输入到联合训练模型中,保证了训练样本的多样性和纯洁性。联合训练模型通过离线精炼硬伪标签和在线精炼软伪标签的相结合的方式从目标域数据集学习更好的特征,以解决
技术介绍
中存在的问题。
[0007]根据本公开的一个方面,提供一种无监督行人重识别模型的建立方法,包括:
[0008]使用图像样本数据集在源域上进行训练,获得训练后的源域模型,所述图像样本中包括行人;
[0009]在目标域创建协作网络与联合网络,将训练后的所述源域模型的模型参数迁移至目标域,以对所述协作网络及所述联合网络进行初始化,其中,所述协作网络包括协作模型,所述联合网络包括第一主模型、第一临时平均模型、第二主模型及第二临时平均模型;
[0010]将所述图像样本数据集分别输入至所述第一临时平均模型和所述第二临时平均模型,获得两组图像样本,分别提取两组图像样本的样本特征,并获取两组图像样本的样本特征的平均样本特征;
[0011]基于所述平均样本特征对所述图像样本数据集进行聚类处理,以获得聚类中心和伪标签,相似的图像样本被赋予相同的伪标签;
[0012]基于所述平均样本特征、聚类处理获得的聚类中心及得到的伪标签对所述图像样本数据集进行图像样本数据集分割处理,分割为信赖集和噪声集;
[0013]基于所述信赖集与所述噪声集对所述联合网络以及所述协作网络进行交替训练,以获得训练后的包括所述协作网络与所述联合网络的无监督行人重识别模型。
[0014]根据本公开的至少一个实施方式的无监督行人重识别模型的建立方法,使用图像样本数据集在源域上进行训练,获得训练后的源域模型,包括:
[0015]创建源域骨架模型,其中,所述图像样本输入所述源域骨架模型之后,所述源域骨架模型输出样本特征表示和每张图片属于某个类的概率;
[0016]开启训练过程,将所述图像样本数据集输入至所述源域骨架模型,直至所述源域骨架模型收敛以获得训练后的源域模型,其中,训练过程中基于由软化交叉熵损失函数和三元组损失函数构成的损失函数进行训练。
[0017]根据本公开的至少一个实施方式的无监督行人重识别模型的建立方法,在所述图像样本数据集输入至所述源域骨架模型进行训练过程之前,还基于随机数据增强的方式对所述图像样本数据集进行增强处理。
[0018]根据本公开的至少一个实施方式的无监督行人重识别模型的建立方法,所述聚类处理为k

means聚类。
[0019]根据本公开的至少一个实施方式的无监督行人重识别模型的建立方法,基于所述平均样本特征、聚类处理获得的聚类中心及得到的伪标签对所述图像样本数据集进行图像样本数据集分割处理,包括:
[0020]输入聚类处理获得的聚类中心、聚类处理获得的伪标签以及图像样本的特征表示;
[0021]基于图像样本的特征表示和所述聚类中心得到每个图像样本距离所述聚类中心的欧式距离,其中,每个聚类中心对应多个图像样本;
[0022]对获得的每个聚类中心与对应的图像样本之间的欧式距离进行排序处理,基于每个聚类中心与对应的图像样本之间的欧式距离的大小生成所述信赖集和所述噪声集。
[0023]根据本公开的至少一个实施方式的无监督行人重识别模型的建立方法,基于每个聚类中心与对应的图像样本之间的欧式距离的大小生成所述信赖集和所述噪声集,包括:
[0024]将距离聚类中心较远的、第一预设比例(例如20%)的图像样本的索引标记为第一标识;
[0025]基于所述第一标识出现的位置挑选出伪标签序列中对应的图像样本,生成噪声集,剩余未被标记的图像样本生成信赖集。
[0026本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种无监督行人重识别模型的建立方法,其特征在于,包括:使用图像样本数据集在源域上进行训练,获得训练后的源域模型,所述图像样本中包括行人;在目标域创建协作网络与联合网络,将训练后的所述源域模型的模型参数迁移至目标域,以对所述协作网络及所述联合网络进行初始化,其中,所述协作网络包括协作模型,所述联合网络包括第一主模型、第一临时平均模型、第二主模型及第二临时平均模型;将所述图像样本数据集分别输入至所述第一临时平均模型和所述第二临时平均模型,获得两组图像样本,分别提取两组图像样本的样本特征,并获取两组图像样本的样本特征的平均样本特征;基于所述平均样本特征对所述图像样本数据集进行聚类处理,以获得聚类中心和伪标签,相似的图像样本被赋予相同的伪标签;基于所述平均样本特征、聚类处理获得的聚类中心及得到的伪标签对所述图像样本数据集进行图像样本数据集分割处理,分割为信赖集和噪声集;以及基于所述信赖集与所述噪声集对所述联合网络以及所述协作网络进行交替训练,以获得训练后的包括所述协作网络与所述联合网络的无监督行人重识别模型。2.根据权利要求1所述的无监督行人重识别模型的建立方法,其特征在于,使用图像样本数据集在源域上进行训练,获得训练后的源域模型,包括:创建源域骨架模型,其中,所述图像样本输入所述源域骨架模型之后,所述源域骨架模型输出样本特征表示和每张图片属于某个类的概率;开启训练过程,将所述图像样本数据集输入至所述源域骨架模型,直至所述源域骨架模型收敛以获得训练后的源域模型,其中,训练过程中基于由软化交叉熵损失函数和三元组损失函数构成的损失函数进行训练。3.根据权利要求2所述的无监督行人重识别模型的建立方法,其特征在于,在所述图像样本数据集输入至所述源域骨架模型进行训练过程之前,还基于随机数据增强的方式对所述图像样本数据集进行增强处理。4.根据权利要求1至3中任一项所述的无监督行人重识别模型的建立方法,其特征在于,所述聚类处理为k

means聚类。5.根据权利要求4所述的无监督行人重识别模型的建立方法,其特征在于,基于所述平均样本特征、聚类处...

【专利技术属性】
技术研发人员:李国鑫曲寒冰王鑫轩朱成博阎刚
申请(专利权)人:北京市新技术应用研究所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1