当前位置: 首页 > 专利查询>河北大学专利>正文

基于分组感知标签的自适应记忆无监督行人重识别方法技术

技术编号:38465925 阅读:15 留言:0更新日期:2023-08-11 14:43
本发明专利技术提供了一种基于分组感知标签的自适应记忆无监督行人重识别方法,包括如下步骤:A、得到具有多组标签的行人数据集;B、计算行人数据集的聚类中心与同一簇中样本之间的距离,构建权重字典;C、构建基于自适应记忆存储结构的师生网络,并利用权重字典更新与样本对应的记忆存储结构;D、在训练过程中,将三个通过设置不同聚类条件生成的具有多组标签的行人数据集平滑噪声的影响;E、根据预设的迭代次数循环操作步骤A—步骤D、对教师网络和学生网络进行训练,F、训练完毕将测试集数据输入,进行测试。本发明专利技术能够优化含有噪声标签的神经网络,探索多标签的行人图像具有判别性的特征,提高行人重识别模型对新场景的适应能力。能力。能力。

【技术实现步骤摘要】
基于分组感知标签的自适应记忆无监督行人重识别方法


[0001]本专利技术涉及一种人工智能、计算机视觉及图像处理领域,具体地说是一种基于分组感知标签的自适应记忆无监督行人重识别方法。

技术介绍

[0002]行人重识别(Re

ID)是一种通过非重叠的摄像机对目标人物图像进行匹配的技术,由于其在监控和公共安全中的广泛应用而引起了人们的广泛关注。在过去几年中,行人重识别技术在有监督的学习场景中已经达到了令人相当满意的程度。然而,由于人工注释跨摄像头标签的代价非常费力且耗时的,而在实际城市的监控场景中,人流量和摄像头数量均相当庞大,标志这样的数据集则极其困难,因此,研究如何无监督场景下更好地实现行人重识别任务成为了当下该领域内重要研究方向。
[0003]现有的数据集都是在不同环境中收集的,包含不同的偏差。在源域上训练的行人重识别模型经常受到域迁移的影响,导致模型在不同目标域上的性能大幅度下降。因此,如何训练拥有良好领域泛化能力的模型是当前亟待解决的问题。要克服上述问题,无监督领域自适应(UDA)是当前最流行的解决方案之一,它解决了源域和目标域之间数据分类不同的情况。然而,UDA总是被用于闭集场景,即假设源域中的类与目标域中的类相同,但在无监督领域自适应行人重识别任务中,使用到的数据集通常为开集,这比传统的UDA更具挑战性。
[0004]除UDA外,对于无监督领域自适应行人重识别任务,通常有两种解决办法。一些方法侧重于将信息从已标记域迁移到未标记域来平滑域间偏差和最小化差异,同时利用生成对抗网络(GAN)来保存源域的身份信息同时学习目标域的风格。这种方法受限于仍与未标签域不同的学习风格的限制,并且可能无法适应没有标签的真实场景。其次,一些方法试图利用未知域之间的关系,为未标记的样本分配伪标签,然后用有监督的方法训练Re

ID模型。
[0005]上述方法中存在以下缺点:
[0006](1)当直接使用现有的聚类方法来产生伪标签时,很难保证聚类结果的准确性,若将聚类结果作为未知领域样本的伪标签,这会在后续的训练阶段造成较大的噪声。而这些噪声标签,会使训练好的Re

ID模型的性能受到损害。
[0007](2)无监督Re

ID模型和有监督Re

ID模型在训练阶段的唯一区别是标签的准确性。在无标签的情况下,会使用聚类算法分配为标签,但是这类方法会出现大量的噪声样本。在很多方法中,只选取置信度高的样本作为训练集,置信度低的样本则会被丢弃。但是,这些被丢弃的样本往往是难辨别的样本,而且与其他样本有很大的差异性。如果丢弃它们,训练有素的Re

ID模型在面对测试集中的相似情况的图像时可能会出现问题。

技术实现思路

[0008]本专利技术的目的就是提供一种基于分组感知标签的自适应记忆无监督行人重识别
方法,以解决现有技术中对于噪声标签阻碍训练过程,从而限制模型泛化能力,导致模型性能不足的问题。
[0009]本专利技术是这样实现的:一种基于分组感知标签的自适应记忆无监督行人重识别方法,包括如下步骤:
[0010]A、以没有标签的目标域图片数据为样本,通过设置不同的聚类条件,对样本进行了DBSCAN聚类算法操作,生成组感知标签,得到具有多组标签的行人数据集;
[0011]B、计算行人数据集的聚类中心与同一簇中样本之间的距离,同一簇中的样本具有不同的权重,构建权重字典a;
[0012]C、构建基于自适应记忆存储结构的师生网络,该网络包括教师网络E
t
、学生网络E
s
和记忆存储模块,其中教师网络E
t
和学生网络E
s
具有相同的网络结构;利用聚类后的特征初始化记忆存储模块,并利用权重字典a更新与样本对应的记忆存储结构;
[0013]D、在训练过程中,将三个通过设置不同聚类条件生成的具有多组标签的行人数据集(表示为和)输入到教师网络E
t
和学生网络E
s
中进行训练,通过教师网络E
t
来存储训练过程中的学生网络E
s
中的参数,在学生网络和教师网络中分别有3个从多种角度对同一行人图片进行描述的输出特征,并利用教师网络与学生网络的之间的对齐学习,平滑噪声的影响;
[0014]E、根据预设的迭代次数循环操作步骤A—步骤D、对教师网络E
t
和学生网络E
s
进行训练,
[0015]F、训练完毕将测试集数据输入,进行测试。
[0016]进一步地,本专利技术可以按如下技术方案实现:
[0017]在所述步骤A中,采用多密度DBSCAN聚类算法生成多组聚类伪标签,输入目标域图片数据,设置聚类条件S={s1,s2,

s
t
,},聚类过程的公式为:
[0018]C,L=Clustering(S)
[0019]其中C和L分别代表聚类中心和聚类所得到的伪标签;
[0020]引入松弛变量γ1和γ2,当聚类条件为∈时,ε

γ1和ε+γ2为同一数据集生成聚类;当∈为群集的正常设置时,ε+γ2放松聚类标准,使每个聚类结果中包含更多样本,而ε

γ1收紧聚类标准,使每个聚类结果中包含少量的样本,由此生成具有多组标签的行人数据集。
[0021]在所述步骤B中,未标记的样本被聚类为N个簇,表示为C={c1,c2,...,c
i
},i∈[1,N];对于每个簇,其中心特征为:
[0022][0023]其中,c
i
表示聚类结果中的第i个簇,K是c
i
中的样本数,是c
i
中的中心特征;对于图像g,g与c
i
之间的距离计算为:
[0024][0025]其中,f
g
是g的特征;
[0026]样本与其对应的记忆存储结构中原有的特征之间的距离计算为:
[0027][0028]其中是c
i
具有的伪标签对应的记忆存储结构中的特征;图像g与簇c
i
中第k个样本距离为:
[0029][0030]得到d
i
后,对其中的元素按降序排列,并保存为ds
i
;通过d
i
和ds
i
计算权重字典a为:
[0031][0032]其中,是在ds
i
中的索引;
[0033]前步骤的输出为对应不同组标签的权重字典a,在每次迭代中,利用该权重字典a对记忆存储结构中的特征进行更新。
[0034]在所述步骤C中,在聚类后,利用聚类后的伪标签初始化记忆存储模块,即,
[0035]M
i

U(X
i
)
[0036]其中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于分组感知标签的自适应记忆无监督行人重识别方法,其特征是,包括如下步骤:A、以没有标签的目标域图片数据为样本,通过设置不同的聚类条件,对样本进行了DBSCAN聚类算法操作,生成组感知标签,得到具有多组标签的行人数据集;B、计算行人数据集的聚类中心与同一簇中样本之间的距离,同一簇中的样本具有不同的权重,构建权重字典a;C、构建基于自适应记忆存储结构的师生网络,该网络包括教师网络E
t
、学生网络E
s
和记忆存储模块,其中教师网络E
t
和学生网络E
s
具有相同的网络结构;利用聚类后的特征初始化记忆存储模块,并利用权重字典a更新与样本对应的记忆存储结构;D、在训练过程中,将三个通过设置不同聚类条件生成的具有多组标签的行人数据集(表示为和输入到教师网络E
t
和学生网络E
s
中进行训练,通过教师网络E
t
来存储训练过程中的学生网络E
s
中的参数,在学生网络和教师网络中分别有3个从多种角度对同一行人图片进行描述的输出特征,并利用教师网络与学生网络的之间的对齐学习,平滑噪声的影响;E、根据预设的迭代次数循环操作步骤A

步骤D、对教师网络E
t
和学生网络E
s
进行训练;F、训练完毕将测试集数据输入,进行测试。2.根据权利要求1所述的基于分组感知标签的自适应记忆无监督行人重识别方法,其特征是,在所述步骤A中,采用多密度DBSCAN聚类算法生成多组聚类伪标签,输入目标域图片数据,设置聚类条件S={s1,s2,...s
t
,},聚类过程的公式为:C,L=Clustering(S)其中C和L分别代表聚类中心和聚类所得到的伪标签;引入松弛变量γ1和γ2,当聚类条件为∈时,ε

γ1和ε+γ2为同一数据集生成聚类;当∈为群集的正常设置时,ε+γ2放松聚类标准,使每个聚类结果中包含更多样本,而ε

γ1收紧聚类标准,使每个聚类结果中包含少量的样本,由此生成具有多组标签的行人数据集。3.根据权利要求1所述的基于分组感知标签的自适应记忆无监督行人重识别方法,其特征是,在所述步骤B中,未标记的样本被聚类为N个簇,表示为C={c1,c2,...,c
i
},i∈[1,N];对于每个簇,其中心特征为:其中,c
i
表示聚类结果中的第i个簇,K是c
i
中的样本数,是c
i
中的中心特征;对于图像g,g与c
i
之间的距离计算为:其中,f
g
是g的特征;样本与其对应的记忆存储结构中原有的特征之间的距离计算为:其中是c
i
具有的伪标签对应的记忆存储结构中的特征;图像g与簇c
i
中第k个样本距离为:
得到d
i
后,对其中的元素按降序排列,并保存为ds
i
;通过d
i
和ds
i
计算权重字典a为:其中,是在ds
i
中的索引;前步骤的输出为对应不同组标签的权重字典a,在每次迭代中,利用该权重字典a对记忆存储结构中的特征进行更新。4.根据权利要求1所述的基于分组感知标签的自适应记忆无监督行人重识别方法,其特征是,在所述步骤C中,在聚类后,利用聚类后的伪标签初始化记忆存储模块,即:M
i

U(X
i
)其中,U(
·
)是均匀采样函数,X
i
表示第i个簇中...

【专利技术属性】
技术研发人员:彭锦佳宋鹏鹏王铖俊于佳左齐静李凯
申请(专利权)人:河北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1