一种行人重识别的生成数据的伪标签分配方法及系统技术方案

技术编号:27977028 阅读:18 留言:0更新日期:2021-04-06 14:11
本发明专利技术给出了一种行人重识别的生成数据的伪标签分配方法及系统,包括利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据并构成无标签数据集;根据动态标签分布为无标签数据集中的无标签的数据分配虚拟标签,再通过设置稀疏化因子随机将一定数量的虚拟标签的权重设置为0,得到稀疏正则化多伪标签;利用Softmax进行预测获得行人属于某个预定义类的概率;根据标签分布和概率,得到优化的交叉熵损失函数;将无标签数据集与稀疏正则化多伪标签进行结合,再与真实数据集融合构成训练样本,根据损失函数对训练样本进行训练得到行人重识别模型。避免了模型在某些预定义类的特征上出现过拟合的现象,提升了模型的泛化性能力。

【技术实现步骤摘要】
一种行人重识别的生成数据的伪标签分配方法及系统
本专利技术涉及图像识别
,尤其是一种行人重识别的生成数据的伪标签分配方法及系统。
技术介绍
行人重识别是智能监控系统中一个重要的研究课题,其目的主要是在跨区域的非重叠摄像机视角下识别出同一个行人。行人重识别是一个具有挑战性的课题,其性能常受行人姿态、光照变化、行人遮挡或错位等因素影响。目前,行人重识别常利用卷积神经网络并结合监督学习的方式获得具有判别力的模型。监督学习的方式需要大量的训练数据集,然而,目前行人重识别的数据集相比于ImageNet这种大型的数据集还是远远不够的。若采用人工方式扩充数据集,需要大量的人工介入。随着生成对抗网络的发展,生成对抗网络可以用来解决扩充数据集需要大量人工介入的问题。目前,利用生成对抗网络生成数据可分为两种类型,一种是利用条件生成对抗网络生成接近真实数据的数据,直接用这些数据来扩充现有数据集;另一种是利用无条件生成对抗网络再生成无标签数据,结合合适的伪标签方式为生成数据打上标签,从而来扩充现有数据集训练样本。目前有许多为生成对抗网络产生的生成数据打上标签的方式,有的会直接将这些生成数据当做新的一类数据。另外一种方式是One-hot虚拟标签策略,选择预定类中最大概率作为生成数据的虚拟标签。在行人重识别,LSRO采用统一分布为生成数据分配标签,MpRL考虑每个预定义类对生成数据的贡献,动态的为生成数据分配虚拟标签。生成对抗网络的生成器会根据原始数据中的特征生成数据,例如根据原始图像中的服装颜色、纹理生成数据。然而,这种方式会造成以下问题:当原始数据中的服装颜色多为暗色,这样生成数据上会倾向生成暗色衣服的行人。由于这样的方式,MpRL在动态分配预定类权重时,会倾向分配更大的权重给这些有暗色衣服的预定义类,这样浅色衣服特征在训练的过程中会被忽略,模型的泛化性会被极大地降低。针对现有技术的不足,本专利技术提供了一种行人重识别的生成数据的伪标签分配方法及系统,用来扩充行人重识别数据集,增加模型的泛化性。首先根据每个预定义类对生成数据集的贡献分配标签,然后对分配的虚拟标签设置稀疏化因子,对某些权重随机设置为0,避免了模型在某些预定义类的特征上出现过拟合的现象,提升了模型的泛化性能力。
技术实现思路
本专利技术提出了一种行人重识别的生成数据的伪标签分配方法及系统,以解决上文提到的现有技术的缺陷。在一个方面,本专利技术提出了一种行人重识别的生成数据的伪标签分配方法,该方法包括以下步骤:S1:利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据,将所述无标签的数据构成数据集Gdata;S2:根据动态标签分布q为所述数据集Gdata中的所述无标签的数据分配虚拟标签,再通过设置稀疏化因子γ随机将一定数量(记为)的所述虚拟标签的权重设置为0,得到稀疏正则化多伪标签;S3:利用Softmax层预测所述数据集Gdata中的行人X所属于的预定义类,获得所述行人X属于预定义类c的概率p(Xc);S4:根据所述标签分布q和所述概率p(Xc),得到优化的交叉熵损失函数l;S5:将所述数据集Gdata与所述稀疏正则化多伪标签进行结合,再与所述真实数据集融合构成训练样本,根据所述l对所述训练样本在神经网络中进行多次迭代训练得到行人重识别模型。以上方法首先根据每个预定义类对生成数据集的贡献分配标签,然后对分配的虚拟标签设置稀疏化因子,对某些权重随机设置为0,避免了模型在某些预定义类的特征上出现过拟合的现象,提升了模型的泛化性能力。在具体的实施例中,所述步骤S2中的根据公式得到,其中K表示预定义类的个数。在具体的实施例中,所述步骤S2中的动态标签分布q具体包括:其中αk表示所述数据集Gdata中的行人X的数据与预定义类k之间的相似度,Is表示权重为0的所述虚拟标签的集合,K表示预定义类的个数,k表示所述预定义类中的第k个类别。在具体的实施例中,所述优化的交叉熵损失函数l为:其中,λ和β为超参数,y表示真实数据和生成数据的区分标签。在具体的实施例中,所述λ和β表示为:其中K表示预定义类的个数。在具体的实施例中,所述稀疏化因子γ的取值区间是[0,1],值越大表示稀疏程度越大,且所述的值越大。在具体的实施例中,所述步骤S4中根据所述l对所述训练样本在神经网络中进行多次迭代训练包括,训练一次后对所述αk进行动态更新再重新执行所述步骤S2-S4。在具体的实施例中,所述y的取值为0或1,当所述X为真实数据时y的取值为0,当所述X为所述数据集Gdata中的数据时y的取值为1。根据本专利技术的第二方面,提出了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机处理器执行时实施上述方法。根据本专利技术的第三方面,提出一种行人重识别的生成数据的伪标签分配系统,该系统包括:无标签数据生成模块:配置用于利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据,将所述无标签的数据构成数据集Gdata;虚拟标签分配模块:配置用于根据动态标签分布q为所述数据集Gdata中的所述无标签的数据分配虚拟标签,再通过设置稀疏化因子γ随机将一定数量(记为)的所述虚拟标签的权重设置为0,得到稀疏正则化多伪标签;数据类型判断模块:配置用于利用Softmax层预测所述数据集Gdata中的行人X所属于的预定义类,获得所述行人X属于预定义类c的概率p(Xc);损失函数构建模块:配置用于根据所述标签分布q和所述概率p(Xc),得到优化的交叉熵损失函数l;行人重识别模型训练模块:配置用于将所述数据集Gdata与所述稀疏正则化多伪标签进行结合,再与所述真实数据集融合构成训练样本,根据所述l对所述训练样本在神经网络中进行多次迭代训练得到行人重识别模型。本专利技术提供了一种行人重识别的生成数据的伪标签分配方法及系统,用来扩充行人重识别数据集,增加模型的泛化性。首先根据每个预定义类对生成数据集的贡献分配标签,然后对分配的虚拟标签设置稀疏化因子,对某些权重随机设置为0,避免了模型在某些预定义类的特征上出现过拟合的现象,提升了模型的泛化性能力。附图说明包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本专利技术的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是本专利技术的一个实施例的一种行人重识别的生成数据的伪标签分配方法的流程图;图3是本专利技术的一个具体的实施例的IDE网络结构图;图4是本专利技术的一个具体的实施例的Two-Stream网络结构图;...

【技术保护点】
1.一种行人重识别的生成数据的伪标签分配方法,其特征在于,包括以下步骤:/nS1:利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据,将所述无标签的数据构成数据集G

【技术特征摘要】
1.一种行人重识别的生成数据的伪标签分配方法,其特征在于,包括以下步骤:
S1:利用深层卷积生成对抗网络的方法在行人重识别的真实数据集的基础上生成无标签的数据,将所述无标签的数据构成数据集Gdata;
S2:根据动态标签分布q为所述数据集Gdata中的所述无标签的数据分配虚拟标签,再通过设置稀疏化因子γ随机将一定数量(记为)的所述虚拟标签的权重设置为0,得到稀疏正则化多伪标签;
S3:利用Softmax层预测所述数据集Gdata中的行人X所属于的预定义类,获得所述行人X属于预定义类c的概率p(Xc);
S4:根据所述标签分布q和所述概率p(Xc),得到优化的交叉熵损失函数l;
S5:将所述数据集Gdata与所述稀疏正则化多伪标签进行结合,再与所述真实数据集融合构成训练样本,根据所述l对所述训练样本在神经网络中进行多次迭代训练得到行人重识别模型。


2.根据权利要求1所述的方法,其特征在于,所述步骤S2中的根据公式得到,其中K表示预定义类的个数。


3.根据权利要求1所述的方法,其特征在于,所述步骤S2中的动态标签分布q具体包括:



其中αk表示所述数据集Gdata中的行人X的数据与预定义类k之间的相似度,Is表示权重为0的所述虚拟标签的集合,K表示预定义类的个数,k表示所述预定义类中的第k个类别。


4.根据权利要求3所述的方法,其特征在于,所述优化的交叉熵损失函数l为:



其中,λ和β为超参数,y表示真实数据和生成数据的区分标签。


5.根据权利要求4所述的方法,其特征在于,所述λ和β表示为:



其中K表示预定义类的个数。


...

【专利技术属性】
技术研发人员:吴俊毅姚灿荣高志鹏赵建强杜新胜
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1