一种基于全局和局部特征学习的行人再识别方法技术

技术编号：21606624 阅读：33 留言：0更新日期：2019-07-13 18:36

本发明专利技术公开了一种基于全局和局部特征学习的行人再识别方法，包括以下步骤：S1、获取训练数据集，将训练数据进行预处理以及数据增强；S2、构建深度卷积神经网络；步骤S3、利用训练数据训练所述网络；S4、获取测试数据集，且对其进行预处理，然后利用训练好的网络提取每个测试集图像的特征；S5、计算每个Query数据的特征与Gallery数据集里的特征的相似度得分；S6、对所有的相似度得分排序，得分最高的Gallery行人图像可以认为和与之对应的query行人是同一个行人，进而得到待识别图像的结果。本发明专利技术提出的网络，不仅简单，而且不需要额外的行人信息就能取得比其他经典方法更高的准确率。

A Pedestrian Recognition Method Based on Global and Local Feature Learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于全局和局部特征学习的行人再识别方法
本专利技术涉及行人再识别
，具体涉及用一种基于全局和局部特征学习的行人再识别方法。
技术介绍
随着社会经济和科技的逐步发展，智能监控技术越来越受到人们的关注。学校，医院，火车站，机场等人流量较大的公共场所都安装了大量的摄像头，将这些海量的视频数据进行研究分析，这在公共安全，刑侦等领域具有重大意义。行人再识别技术是指在某一个摄像头已经出现过一个行人，当该行人在另一个摄像头在再次出现的时候，我们需要将他识别出来。行人再识别技术不同于人脸识别。人脸识别中使用到的人脸图像背景比较单一，人脸比较清晰，易于辨析。而行人再识别中的行人图像分辨率较低，人脸信息模糊，背景较为复杂，难以正确匹配；其次，不同摄像头之间的拍摄角度存在很大差异，行人在每次出现的姿态或者是体貌特征都有可能发生变化。基于这些特点，使得我们对图像的分析，行人特征的提取都非常困难。目前的行人再识别领域的技术大致分为两类:第一类是研究行人对象的特征表示方法，提取更具有鲁棒性的鉴别特征对行人进行表示；第二类使用距离度量学习方法，通过学习一个有判别力的距离度量函数，使得同一个人的图像距离小于不同行人图像间的距离。最近几年随着深度学习的发展，更多的方法关注在行人的特征表示这一方面，主流的技术有三种：第一类是全局特征，全局特征关注的是全局信息，比如行人的性别，身体形态，衣服颜色等。但是，全局特征往往容易丢失细节上的信息以及行人检测上的错误。第二类是局部特征，很多方法直接将整个行人图片分成几个固定的部分，然后将它们输入神经网络中训练，但是这种方式忽略了行人的姿态变化和...

【技术保护点】
1.一种基于全局和局部特征学习的行人再识别方法，其特征在于，所述方法包括以下步骤：步骤S1、获取训练数据集，将训练数据进行预处理以及数据增强；步骤S2、构建深度卷积神经网络；步骤S3、利用处理好的训练数据训练所述深度卷积神经网络；步骤S4、获取测试数据集，且对其进行预处理，然后利用训练好的深度卷积神经网络提取测试数据集中所有图像的特征；步骤S5、计算每个查询集(Query)数据的特征与候选集(Gallery)数据集里的特征的相似度得分；所述的特征是指步骤S4中的特征；步骤S6、对所有的相似度得分排序，得分最高的Gallery行人图像则认为和与之对应的Query行人是同一个行人，进而得到待识别图像的结果。

【技术特征摘要】
1.一种基于全局和局部特征学习的行人再识别方法，其特征在于，所述方法包括以下步骤：步骤S1、获取训练数据集，将训练数据进行预处理以及数据增强；步骤S2、构建深度卷积神经网络；步骤S3、利用处理好的训练数据训练所述深度卷积神经网络；步骤S4、获取测试数据集，且对其进行预处理，然后利用训练好的深度卷积神经网络提取测试数据集中所有图像的特征；步骤S5、计算每个查询集(Query)数据的特征与候选集(Gallery)数据集里的特征的相似度得分；所述的特征是指步骤S4中的特征；步骤S6、对所有的相似度得分排序，得分最高的Gallery行人图像则认为和与之对应的Query行人是同一个行人，进而得到待识别图像的结果。2.根据权利要求1所述的行人再识别方法，其特征在于，所述测试数据集包括Query数据集和Gallery数据集。3.根据权利要求1所述的行人再识别方法，其特征在于，所述步骤S1的预处理是把每个行人的RGB图像大小调整成256*144，并且对其均值归一化；数据增强方式包括随机裁剪即将图像尺寸大小裁剪为256*128以及水平翻转方式。4.根据权利要求1所述的行人再识别方法，其特征在于，所述步骤S2深度卷积神经网络的构建包括以下步骤：步骤S21、截取Resnet50的最后一层卷积层Conv5的之前的所有网络层，包括卷积层Conv5，并且使用在ImageNet数据集上预训练好的参数对其初始化；所述参数包括权重向量θ1，θ2，...，θm，...θn；步骤S22、对Conv5的输出X进行局部池化(LocalAveragePooling)，即是将该输出切分成k个部分(Part)，再分别对这k个部分池化，其池化的感受野是(H/k)*W，其中H，W和k分别是Conv5的输出的长和宽和切分的部分的数量，每个Part的每个元素表示为：这里，Xc，i，j表示卷积层Conv5输出的每个元素，i，j分别表示在长和宽方向上的索引，c表示第c维通道，Δ＝H/k；步骤S23、对切分得到的每个Part进行映射(Mapping)学习，映射之后的结果为：其中，Vc，k表示映射学习得到的结果...

【专利技术属性】
技术研发人员：晋建秀，王鹏，邢晓芬，青春美，徐向民，
申请(专利权)人：华南理工大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人