一种基于深度多索引哈希的行人重识别方法技术

技术编号：21433226 阅读：19 留言：0更新日期：2019-06-22 12:13

本发明专利技术公开了一种基于深度多索引哈希的行人重识别方法，达到了非重叠视角域多摄像头网络场景下行人检索存储空间低且检索高效的效果。该方法首先从原始视频数据中构造行人图片训练集，再结合深度学习构造端到端的有互反馈的多粒度特征学习网络，基于训练集对网络模型进行训练，得到哈希函数和训练集对应的哈希编码，并基于哈希编码构建索引。对于摄像头新收集的数据，使用哈希函数计算对应的哈希编码，并实时增加到索引中。在线检索时，对于给定的目标行人图片，首先使用多粒度网络模型进行特征的提取，使用哈希函数计算目标行人图片的哈希编码，然后基于哈希编码在索引中进行近邻检索，最后基于实值特征在近邻范围内进行重排序，得到检索结果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度多索引哈希的行人重识别方法
本专利技术涉及一种基于深度多索引哈希的行人重识别方法，用于实现非重叠视角域多摄像头网络场景下利用低存储空间的高效行人检索。
技术介绍
随着计算机视觉技术的发展，图像和视频等相关的应用在国民日常生活中的地位日益突出。此外，图像处理学科既是科学领域中具有挑战的研究方向，也是工程领域中的重要应用技术。行人重识别是近几年计算机视觉领域新兴的研究热点，是指在非重叠视角域多摄像头网络场景下进行行人匹配的任务，即确认不同位置的摄像头在不同的时刻拍摄到的行人目标是否为同一行人，属于在复杂视频环境下的图像处理和分析范畴，是许多监控和安防应用中的主要任务。由于公共安全需求的增加，以及摄像监控网络规模的扩大，单纯依靠人力劳动力进行行人重识别任务的成本极高，甚至是无法完成的。因此在大规模行人数据中，如何自动准确地进行待查询行人的匹配备受关注。大多数的行人重识别研究工作主要关注算法的效果却很少在意其检索的效率。在实际的应用中，行人图片数据是呈爆炸式增长的，因此设计一种准确、高效的行人重识别算法至关重要。
技术实现思路
专利技术目的：为了解决这个问题，本专利技术主要从哈希学习的角度出发，用离散哈希对行人图片进行表示，一方面降低行人图片的存储开销，另一方面通过哈希检索技术在海明空间内进行行人图片的匹配，大大提高了算法运行的效率。技术方案：一种基于深度多索引哈希的行人重识别方法，引入多索引哈希意在解决行人图片的存储开销大以及检索效率低的问题。同时，通过多粒度深度网络学习行人图片的实值特征表示和哈希编码来提升算法性能。主要包括特征学习和多索引哈希检索两部...

【技术保护点】
1.一种基于深度多索引哈希的行人重识别方法，其特征在于，该方法包括以下的步骤：1)基于行人区域检测技术，从原始视频数据中构造行人图片训练集；2)基于行人图片训练集，构建并训练多粒度网络模型，得到哈希函数以及训练集图片对应的实值特征和哈希编码；3)基于哈希编码，设计分块划分策略构建索引；4)对于摄像头新收集的数据，使用哈希函数计算哈希编码，并实时增加到索引中；5)对于给定的目标行人图片，使用哈希函数计算哈希编码，基于哈希编码在索引中进行检索，再基于实值特征进行重排序。

【技术特征摘要】
1.一种基于深度多索引哈希的行人重识别方法，其特征在于，该方法包括以下的步骤：1)基于行人区域检测技术，从原始视频数据中构造行人图片训练集；2)基于行人图片训练集，构建并训练多粒度网络模型，得到哈希函数以及训练集图片对应的实值特征和哈希编码；3)基于哈希编码，设计分块划分策略构建索引；4)对于摄像头新收集的数据，使用哈希函数计算哈希编码，并实时增加到索引中；5)对于给定的目标行人图片，使用哈希函数计算哈希编码，基于哈希编码在索引中进行检索，再基于实值特征进行重排序。2.如权利要求1所述的基于深度多索引哈希的行人重识别方法，其特征在于，所述步骤1)中，对于来自监控摄像头的原始视频数据，首先需要进行视频切帧操作，然后对切帧后的图片数据进行行人区域检测，以生成行人图片作为训练集。3.如权利要求1所述的基于深度多索引哈希的行人重识别方法，其特征在于，所述步骤2)中，使用预训练的卷积神经网络多粒度网络模型提取行人图片的特征表示，预训练的卷积神经网络多粒度网络模型以ResNet-50作为主干，并将其划分为：全局分支、上下身分支、上中下身分支；在训练和测试的过程中将三个分支的输出进行合并从而得到行人图片的实值特征表示，这样的特征表示蕴含了多粒度的行人信息；对于每一个分支，在特征表示层后添加一层全连接层作为哈希层，哈希层的维度对应于哈希编码的长度；在多粒度网络模型的训练过程中，使用归一化指数函数损失为行人图片的实值特征表示建模，使用三元组损失为行人图片的哈希编码建模，使用多索引查询敏感损失来为检索进行加速；在求解时，使用梯度反向传播优化深度网络的参数。4.如权利要求1所述的基于深度多索引哈希的行人重识别方法，其特征在于，步骤3)中，在需要建立多个哈希索引的情况下，使用分块划分策略，对行人图片的哈希编码进行划分，划分后的子串分别进行索引的建立，从而缓解直接对哈希编码进行划分可能导致的单个索引中不存在多粒度的信息，即多粒度的信息在划分过程中遭到破坏的问题。5.如权利要求1所述的基于深度多索引哈希的行人重识别方法，其特征在于，步骤5)中，对于给定的目标行人图片，将该图片作为多粒度网络模型的输入，计算并输出对应的实值特征表示和哈希编码；然后基于哈希编码，使用多索引哈希检索技术在内存中检索待查询行人图片的近邻；将保存在外存中的近邻图片的实值特征读入内存，计算其与目标行人图片的实值特征之间的欧氏距离，并根据计算得到的欧氏距离对近邻图片进行升序排序，再根据检索的要求按序返回检索结果。...

【专利技术属性】
技术研发人员：李武军，李明威，蒋庆远，
申请(专利权)人：南京大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人