一种基于增广样本和多流层的行人检索方法技术

技术编号：20243009 阅读：24 留言：0更新日期：2019-01-29 23:31

本发明专利技术实施例公开了一种基于增广样本和多流层的行人检索方法，该方法包括：构建基于增广样本和多流层的深度神经网络；获取训练集，利用深度卷积生成对抗网络产生生成样本扩充训练集；从训练集中选择B个真实样本和B个生成样本作为深度神经网络输入；利用深度神经网络多流层得到行人特征表示；送入混合四元组损失，并基于损失值优化深度神经网络；利用训练完成的深度神经网络提取待查询样本最终特征表示，并且利用特征向量之间的相似度获得待查询样本的匹配结果。本发明专利技术利用多流层学习不同方面的行人特征，并利用混合四元组损失得到具有判别性的特征空间，不但减小了过拟合的风险还提高了网络的泛化能力，从而提高行人检索匹配的正确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于增广样本和多流层的行人检索方法
本专利技术属于计算机视觉、深度学习、人工智能
，具体涉及一种基于增广样本和多流层的行人检索方法。
技术介绍
行人检索旨在从不同角度架设的摄像机中检索特定行人，它在视频检索、多相机跟踪、行为识别等应用中扮演着重要的角色。然而行人检索还面临诸多挑战，例如姿态变化、视角变化、光照变化和遮挡。目前，由于深度神经网络在特征学习中的优势，它被广泛应用于行人检索领域。然而，训练样本数量和模型结构对深度神经网络的性能产生较大影响。第一，在训练深度神经网络时，需要大量的样本，但是大多数现有的数据库都比较小，可能导致过拟合。第二，在实际应用中，因为行人可能穿着相似的衣服，所以很难从他们的外表进行辨别。因此，研究减小过拟合的方法和学习具有判别性的特征对行人检索的性能至关重要。就减小过拟合而言，最直接的方法是增加训练样本数量。为了增加训练样本，Zhong等人在原始样本上随机地选择一个矩形区域，然后利用随机值替换这个区域的像素值从而增加样本；Simonyan等人将样本随机翻转得到新图像之后去扩大训练集；Zheng等人利用DCGAN模型生成额外的样本，并且为每个生成样本分配一个额外的标签用于监督学习。然而，这些方法都不能直接利用生成样本减小模型的过拟合。此外，模型的损失函数与模型结构会严重影响判别性特征的学习。Zhang等人利用交叉熵损失计算行人样本属于任何一类的概率；Hermans等人提出三元组损失，在减小类内变化的同时增加类间变化；Zheng等人使用识别深度神经网络和验证深度神经网络联合学习判别性较强的特征。然而，这些网络模型的结构都...

【技术保护点】
1.一种基于增广样本和多流层的行人检索方法，其特征在于，该方法包括以下步骤：步骤S1，构建基于增广样本和多流层的深度神经网络；步骤S2，获取训练集，利用深度卷积生成对抗网络产生生成样本，并用这些生成样本扩充训练集；步骤S3，从所述训练集中选择B个真实样本和B个生成样本作为所述基于增广样本和多流层的深度神经网络的输入；步骤S4，在训练过程中，利用所述深度神经网络的多流层从不同方面学习行人的微妙差别，得到行人具有判别性的特征表示；步骤S5，把行人的特征表示送入混合四元组损失，并基于得到的损失值对于所述基于增广样本和多流层的深度神经网络进行优化，得到训练完成的基于增广样本和多流层的深度神经网络；步骤S6，在测试过程中，将待查询样本作为输入，利用训练完成的基于增广样本和多流层的深度神经网络提取多流层的输出作为所述待查询样本最终的特征表示，并根据所述待查询样本与搜索库中样本特征向量之间的相似度得到所述待查询样本的匹配结果。

【技术特征摘要】
1.一种基于增广样本和多流层的行人检索方法，其特征在于，该方法包括以下步骤：步骤S1，构建基于增广样本和多流层的深度神经网络；步骤S2，获取训练集，利用深度卷积生成对抗网络产生生成样本，并用这些生成样本扩充训练集；步骤S3，从所述训练集中选择B个真实样本和B个生成样本作为所述基于增广样本和多流层的深度神经网络的输入；步骤S4，在训练过程中，利用所述深度神经网络的多流层从不同方面学习行人的微妙差别，得到行人具有判别性的特征表示；步骤S5，把行人的特征表示送入混合四元组损失，并基于得到的损失值对于所述基于增广样本和多流层的深度神经网络进行优化，得到训练完成的基于增广样本和多流层的深度神经网络；步骤S6，在测试过程中，将待查询样本作为输入，利用训练完成的基于增广样本和多流层的深度神经网络提取多流层的输出作为所述待查询样本最终的特征表示，并根据所述待查询样本与搜索库中样本特征向量之间的相似度得到所述待查询样本的匹配结果。2.根据权利要求1所述的方法，其特征在于，所述步骤S1包括以下步骤：步骤S11，选择预训练神经网络并对网络的参数赋值；步骤S12，修改所述预训练神经网络并在其基础上添加多流层结构得到所需要的基于增广样本和多流层的深度神经网络。3.根据权利要求2所述的方法，其特征在于，所述步骤S12包括以下步骤：步骤S121，移除所述预训练神经网络中最后的平均池化层和全连接层，得到修改后的预训练神经网络；步骤S122，在得到的预训练神经网络之后添加多流层结构构成所需要的基于增广样本和多流层的深度神经网络。4.根据权利要求3所述的方法，其特征在于，所述步骤S122包括以下步骤：步骤S1221，在所述预训练神经网络之后设置三个流结构，每个流结构包括一个卷积层和一个平均池化层；步骤S1222，在三个流结构之后添加一个最大池化层，构成多流层。5.根据权利要求1所述的方法，其特征在于，所述步骤S2包括以下步骤：步骤S21，将所述训练集中每一幅行人样本的大小调整到第一预设大小，并将这些行人样本作为深度卷积生成对抗网络中判别...

【专利技术属性】
技术研发人员：刘爽，郝晓龙，张重，
申请(专利权)人：天津师范大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人