一种行人重识别的生成数据的伪标签分配方法及系统技术方案

技术编号：27977028 阅读：18 留言：0更新日期：2021-04-06 14:11

本发明专利技术给出了一种行人重识别的生成数据的伪标签分配方法及系统，包括利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据并构成无标签数据集；根据动态标签分布为无标签数据集中的无标签的数据分配虚拟标签，再通过设置稀疏化因子随机将一定数量的虚拟标签的权重设置为0，得到稀疏正则化多伪标签；利用Softmax进行预测获得行人属于某个预定义类的概率；根据标签分布和概率，得到优化的交叉熵损失函数；将无标签数据集与稀疏正则化多伪标签进行结合，再与真实数据集融合构成训练样本，根据损失函数对训练样本进行训练得到行人重识别模型。避免了模型在某些预定义类的特征上出现过拟合的现象，提升了模型的泛化性能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种行人重识别的生成数据的伪标签分配方法及系统
本专利技术涉及图像识别
，尤其是一种行人重识别的生成数据的伪标签分配方法及系统。
技术介绍
行人重识别是智能监控系统中一个重要的研究课题，其目的主要是在跨区域的非重叠摄像机视角下识别出同一个行人。行人重识别是一个具有挑战性的课题，其性能常受行人姿态、光照变化、行人遮挡或错位等因素影响。目前，行人重识别常利用卷积神经网络并结合监督学习的方式获得具有判别力的模型。监督学习的方式需要大量的训练数据集，然而，目前行人重识别的数据集相比于ImageNet这种大型的数据集还是远远不够的。若采用人工方式扩充数据集，需要大量的人工介入。随着生成对抗网络的发展，生成对抗网络可以用来解决扩充数据集需要大量人工介入的问题。目前，利用生成对抗网络生成数据可分为两种类型，一种是利用条件生成对抗网络生成接近真实数据的数据，直接用这些数据来扩充现有数据集；另一种是利用无条件生成对抗网络再生成无标签数据，结合合适的伪标签方式为生成数据打上标签，从而来扩充现有数据集训练样本。目前有许多为生成对抗网络产生的生成数据打上标签的方式，有的会直接将这些生成数据当做新的一类数据。另外一种方式是One-hot虚拟标签策略，选择预定类中最大概率作为生成数据的虚拟标签。在行人重识别，LSRO采用统一分布为生成数据分配标签，MpRL考虑每个预定义类对生成数据的贡献，动态的为生成数据分配虚拟标签。生成对抗网络的生成器会根据原始数据中的特征生成数据，例如根据原始图像中的服装颜色、纹理生成数据。然

【技术保护点】
1.一种行人重识别的生成数据的伪标签分配方法，其特征在于，包括以下步骤：/nS1：利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据，将所述无标签的数据构成数据集G

【技术特征摘要】
1.一种行人重识别的生成数据的伪标签分配方法，其特征在于，包括以下步骤：
S1：利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据，将所述无标签的数据构成数据集Gdata；
S2：根据动态标签分布q为所述数据集Gdata中的所述无标签的数据分配虚拟标签，再通过设置稀疏化因子γ随机将一定数量(记为)的所述虚拟标签的权重设置为0，得到稀疏正则化多伪标签；
S3：利用Softmax层预测所述数据集Gdata中的行人X所属于的预定义类，获得所述行人X属于预定义类c的概率p(Xc)；
S4：根据所述标签分布q和所述概率p(Xc)，得到优化的交叉熵损失函数l；
S5：将所述数据集Gdata与所述稀疏正则化多伪标签进行结合，再与所述真实数据集融合构成训练样本，根据所述l对所述训练样本在神经网络中进行多次迭代训练得到行人重识别模型。

2.根据权利要求1所述的方法，其特征在于，所述步骤S2中的根据公式得到，其中K表示预定义类的个数。

3.根据权利要求1所述的方法，其特征在于，所述步骤S2中的动态标签分布q具体包括：

其中αk表示所述数据集Gdata中的行人X的数据与预定义类k之间的相似度，Is表示权重为0的所述虚拟标签的集合，K表示预定义类的个数，k表示所述预定义类中的第k个类别。

4.根据权利要求3所述的方法，其特征在于，所述优化的交叉熵损失函数l为：

其中，λ和β为超参数，y表示真实数据和生成数据的区分标签。

5.根据权利要求4所述的方法，其特征在于，所述λ和β表示为：

其中K表示预定义类的个数。

...

【专利技术属性】
技术研发人员：吴俊毅，姚灿荣，高志鹏，赵建强，杜新胜，
申请(专利权)人：厦门市美亚柏科信息股份有限公司，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人