基于深度相互学习的跨域行人重识别方法及系统技术方案

技术编号：34461484 阅读：25 留言：0更新日期：2022-08-06 17:24

本发明专利技术涉及一种基于深度相互学习的跨域行人重识别方法及系统，该方法包括：将初始网络在源域中预训练得到基础网络；构建三分支相互学习网络框架并在目标域中训练，每个分支包括主网络PNet、平均网络Mean Net和难样本筛选分类器FNet；在每个分支中，FNet将样本由易到难地输入PNet训练，同时FNet采用三元组损失训练；PNet得到FNet判断的简单样本后传输给Mean Net，并判断样本对应的软伪标签；当任意两个分支由Mean Net提取的样本特征之间的余弦相似度小于设定阈值时，将该样本认定为高置信度样本并用其更新第三分支中网络；迭代训练结束后，选择三个分支中性能最好的Mean Net用于跨域行人重识别。该方法及系统有利于提高跨域行人重识别的准确性。人重识别的准确性。人重识别的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度相互学习的跨域行人重识别方法及系统

[0001]本专利技术属于计算机视觉
，具体涉及一种基于深度相互学习的跨域行人重识别方法及系统。

技术介绍

[0002]行人重识别技术是计算机视觉、人工智能等学科的研究热点。行人重识别主要用于判断在不同的时间、不同的摄像机下拍摄的行人图片是否为同一行人。随着数字城市与智慧城市的发展，行人重识别已经被广泛应用于视频监控、刑侦安保、智能安防等领域。
[0003]行人重识别的目的是从海量的视频、图片数据中准确地找到特定行人，使计算机能替代人工快速准确的在冗杂的监控视频、图片中检索到目标行人。随着深度学习的广泛应用，基于深度学习的行人重识别方法为解决行人重识别中常见的挑战带来了新的思路。现有的基于深度学习的行人重识别方法主要分为两类：基于监督学习的行人重识别方法和基于无监督学习的行人重识别方法。基于监督学习的行人重识别方法使用数据集中图片的真实标签作为监督信号，输入的图片经过卷积神经网络的卷积与池化后，提取出其特征表示，并通过度量学习的方式优化模型，最终在测试集中测试。而基于无监督学习的行人重识别方法要求在输入数据都是无标签的情况下，训练出较好的模型性能，进而识别出目标行人。相比于基于监督学习的行人重识别方法，基于无监督学习的行人重识别方法不需要对训练数据进行标注，使用无标签数据直接训练行人重识别模型，更符合现实场景中行人重识别方法的要求。
[0004]Deepreid(Li W,Zhao R,Xiao T,et al.Deepreid:Deep filter...

【技术保护点】

【技术特征摘要】
1.一种基于深度相互学习的跨域行人重识别方法，其特征在于，包括以下步骤：步骤A、将初始网络在源域中预训练，得到基础网络，并将基础网络用于目标域的训练和微调；步骤B、构建三分支相互学习网络模型并在目标域中训练，所述三分支相互学习网络模型的每个分支包括一个主网络PNet、一个平均网络Mean Net和一个难样本筛选分类器FNet；步骤C、在每个分支中，FNet将样本由易到难地输入PNet训练，同时FNet采用三元组损失训练；步骤D、每个分支中的PNet得到FNet判断的简单样本后，将这些样本传输给Mean Net，并判断样本对应的软伪标签；步骤E、三个分支中由Mean Net提取的样本特征之间进行余弦相似性度量，当任意两个分支之间的余弦相似度小于设定的阈值时，将该样本认定为高置信度样本，并用此样本更新第三分支中的网络；步骤F、按步骤C、D、E进行迭代，直至所有样本训练结束；选择三个分支中性能最好的Mean Net在测试集中测试，测试通过后用得到的Mean Net进行跨域行人重识别。2.根据权利要求1所述的基于深度相互学习的跨域行人重识别方法，其特征在于，所述步骤A中，将源域中的数据表示为目标域上的数据表示为其中和分别表示源域中当前批次的第i个训练数据和其对应的真实标签；则表示目标域中当前批次的第i个训练数据，在目标域中的数据没有提供其对应的真实标签；N
s
和N
t
分别表示源域和目标域中训练样本数量；选择ResNet
‑
50为初始网络，定义初始网络参数为θ，在给定训练数据集S的情况下，网络将输入的样本转化为特征表示其中f(
·
|θ)是网络的特征提取函数；通过分类损失和三元组损失训练网络，以提高网络的判别能力和自适应能力；其中，分类损失表示为：其中，表示输入的图片属于真实标签的概率；三元组损失表示为：其中，对于锚点来说，表示最不相似的正样本；表示最相似的负样本；m是三元组损失的余量值；和分别表示源域中正样本的特征、负样本的特征和锚点样本的特征；max(
·
)表示选择最大值；||
·
||2表示L2范数；在每一个训练最小批次中，选定一个锚点后，与锚点属于同一类的样本属于正样本，反之则为负样本；当正样本与锚点的距离大于负样本与锚点的距离加余量值m时，损失函数值大于零，进而更新基础网络的参数θ。3.权利要求1所述的基于深度相互学习的跨域行人重识别方法，其特征在于，所述步骤
B中，对目标域中无标签图片进行随机噪声处理，并将图片裁剪成256像素
×
128像素，分别输入所述三分支相互学习网络模型的三个分支训练主网络、平均网络和难样本筛选分类器；在目标域训练初始阶段，每个分支的各网络参数一致，但随着训练过程中网络输入样本不同，网路参数逐渐表现出差异。4.权利要求1所述的基于深度相互学习的跨域行人重识别方法，其特征在于，所述步骤C的实现方法为：难样本筛选分类器FNet通过DBSCAN聚类方法对输入样本进行筛选，在聚类空间中距离簇中心近的样本为简单样本，并将这些样本输入PNet更新其网络参数，同时不直接丢弃困难样本，而是等待下轮迭代时再次判断其难易程度；对于输入样本难易程度的判断，使用Jaccard距离度量每个样本点到聚类中心的距离；首先计算目标域样本间的成对相似性矩阵M
ij
，计算公式表示为：其中，M
ij
是样本特征表示和之间的相似性矩阵，使用样本特征来计算样本和之间的相似性，表示样本的k
‑
倒数集；通过样本成对相似性矩阵计算Jaccard距离，定义为：通过计算相似性矩阵M
ij
和Jaccard距离利用DBSCAN聚类方法将目标域中的无标签样本分为简单样本和困难样本；简单样本是在聚类过程中距离聚类中心更近的样本，这类样本预测的伪标签也越准确；难样本筛选分类器FNet使用三元组损失更新，表示为：其中，N
t
表示目标域中训练样本数量；分别表示目标域中的锚点样本，正样本和负样本；f(
·
)表示特征提取函数，将输入的目标域图片转化为特征表示；n表示三元组损失余量。5.权利要求1所述的基于深度相互学习的跨域行人重识别方法，其特征在于，所述步骤D的实现方法为：无标签数...

【专利技术属性】
技术研发人员：陈思，田梓民，王大寒，朱顺痣，吴芸，
申请(专利权)人：厦门理工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人