基于多任务深度学习快速哈希车辆检索方法技术

技术编号：17655068 阅读：107 留言：0更新日期：2018-04-08 08:24

一种基于多任务深度学习快速哈希车辆检索方法，包括用于深度学习和训练识别的多任务深度卷积神经网络、用于提高检索精度和检索方法实用性的分段紧凑哈希码及实例特征的特征融合方法、用于提升检索性能的局部敏感哈希再排序算法和用于提升检索引擎鲁棒性和准确性的跨模态检索方法。首先，提出了一种多任务深度卷积网络分段学习哈希码方法，将图像语义和图像表示相结合，利用相关任务之间的联系提高检索精度和细化图像特征，同时采用最小化图像编码使学习到的车辆特征更具有鲁棒性；其次，选用特征金字塔网络再提取车辆图像的实例特征；接着，利用局部敏感哈希再排序方法对提取到的特征进行检索；最后，对无法获取查询车辆目标图像的特殊情况采用跨模态辅助车辆检索方法。

全部详细技术资料下载

【技术实现步骤摘要】
基于多任务深度学习快速哈希车辆检索方法
本专利技术涉及人工智能、数字图像处理、卷积神经网络和计算机视觉在公共安全领域方面的应用，属于智能交通领域。
技术介绍
在智慧城市、智能交通迅速发展的今天，公共安全系统中大规模图像监控及视频数据库的车辆识别、车辆检索的需求急剧增长。现有技术中，对于车辆的检索方法，主要是提取目标车辆的车牌信息。然后，再根据车牌信息对待检索机动车辆进行检索。一般具体做法是从监控图像中识别车辆的车牌号码，然后再在其他监控图像中识别是否具有该车牌号码的机动车辆。这种仅仅依靠车牌号进行检索的方法虽然容易实现，但是，对于无法获取到牌照信息的机动车辆，如假牌套牌车辆则无法进行有效检索。基于外观特征的车辆检索技术不仅能弥补传统车牌识别方法的局限和不足，在智能车辆检索，尤其在违章稽查、肇事追捕、犯罪嫌疑车辆锁定，套牌车辆鉴别，以及加快刑侦破案效率和速度都具有非常重要的现实意义和十分广阔的应用前景。现有的车辆检索方法基本上是利用sift、surf、dog等算法提取目标车辆图像的整幅图像特征，将该特征作为目标特征，利用相同的算法提取数据库中各个车辆图像的整幅图像特征，将该特征作为待匹配特征，计算目标特征与各个待匹配特征之间的欧式距离，将欧式距离最近的待匹配特征对应的车辆作为目标车辆。车辆检索要求在一系列外形相似的车辆中找出特定目标的车辆，这就使得工作变得更具挑战性；不仅如此，还要考虑到实际情况，诸如监控环境、天气情况以及光照条件等因素的影响。最近几年深度学习在计算机视觉领域的技术得到了迅速的发展，深度学习能利用大量的训练样本和隐藏层逐层深入地学习图像的抽象...
基于多任务深度学习快速哈希车辆检索方法

【技术保护点】
一种基于多任务深度学习快速哈希车辆检索方法，其特征在于：所述车辆检索方法包括以下步骤：第一步，构建用于深度学习和训练识别的多任务深度卷积神经网络；第二步，采用分段紧凑哈希码及实例特征的特征融合方法；第三步，采用局部敏感哈希再排序算法；第四步，采用跨模态检索方法，实现车辆检索。

【技术特征摘要】
1.一种基于多任务深度学习快速哈希车辆检索方法，其特征在于：所述车辆检索方法包括以下步骤：第一步，构建用于深度学习和训练识别的多任务深度卷积神经网络；第二步，采用分段紧凑哈希码及实例特征的特征融合方法；第三步，采用局部敏感哈希再排序算法；第四步，采用跨模态检索方法，实现车辆检索。2.如权利要求1所述的基于多任务深度学习快速哈希车辆检索方法，其特征在于：所述第一步中，采用FasterR-CNN作为多任务卷积神经网络的基础网；网络最前面的是3×3卷积网络，称为conv1，后面紧接4个堆叠卷积模块命名为conv2_x到conv5_x，每个模块分别包含了{2,3,3,3}个单元，conv1到conv4_3作为共享网络；其后是RPN，即区域建议网络，RPN网络将一个任意尺度图像作为输入，输出矩形目标建议框的集合，每个框包含4个位置坐标变量和一个得分；为了生成区域建议框，在最后一个共享的卷积层输出的卷积特征映射上滑动小网络，这个网络全连接到输入卷积特征映射的n×n的空间窗口上；每个滑动窗口映射到一个低维向量上，每个特征映射的一个滑动窗口对应一个数值；这个向量输出给两个同级的全连接的层；所述的RPN；RPN网络将一个任意尺度图像作为输入，输出矩形目标建议框的集合，每个框包含4个位置坐标变量和一个得分；所述的矩形目标建议框的目标指的是车辆对象；对每个建议框是目标/非目标的估计概率，是用二分类的softmax层实现的分类层；k个建议框被相应的k个称为anchor的建议框参数化；每个anchor以当前滑动窗口中心为中心，并对应一种尺度和长宽比，使用3种尺度和3种长宽比，这样在每一个滑动位置就有k＝9个anchor；为了训练RPN网络，给每个anchor分配一个二进制的标签，以此来标注该anchor是不是目标；然后分配正标签给这两类anchor：(I)与某个真正目标包围盒，即GroundTruth，GT有最高的IoU，即Interse-ction-over-Union，交集并集之比，重叠的anchor；(II)与任意GT包围盒有大于0.7的IoU交叠的anchor；注意到一个GT包围盒可能给多个anchor分配正标签；分配负标签给与所有GT包围盒的IoU比率都低于0.3的anchor；非正非负的anchor对训练目标没有任何作用，则弃用；遵循FasterR-CNN中的多任务损失，最小化目标函数；对一个图像的损失函数定义为：这里，i是一个anchor的索引，pi是anchor是第i目标的预测概率，如果anchor为正，GT标签就是1，如果anchor为负，就是0；ti是一个向量，表示预测的包围盒的4个参数化坐标，是与正anchor对应的GT包围盒的坐标向量；λ是一个平衡权重，Ncls是cls项的归一化值为mini-batch的大小，Nreg是reg项的归一化值为anchor位置的数量，分类损失函数Lcls是两个类别，即机动车辆目标vs.道路背景的对数损失：对于回归损失函数Lreg，用以下函数定义：式中，Lreg为回归损失函数，R是鲁棒的损失函数，用公式(4)计算smoothL1；式中，smoothL1为smoothL1损失函数，x为变量。3.如权利要求1或2所述的基于多任务深度学习快速哈希车辆检索方法，其特征在于：所述多任务深度卷积神经网络中，设计一种多任务目标函数是至关重要的；多任务目标函数用公式(5)表示；式中，是输入特征向量和权重参数wt的映射函数，L(·)为损失函数，Φ(wt)为权重参数的正则化值，T为总任务数，对于第t个任务的训练数据记为其中t∈(1,T)，i∈(1,N)，N为总训练样本数，分别为第i样本的特征向量和标注标签；对于损失函数，利用softmax配合对数似然代价函数训练最后一层的特征，实现多任务图像分类，softmax损失函数用公式(6)定义，式中，xi为第i深度特征，Wj为最后一个全连接层中权重的第j列，b是偏置项，m,n分别为处理样本数量与类别数。4.如权利要求1或2所述的基于多任务深度学习快速哈希车辆检索方法，其特征在于：所述第二步中，分段紧凑哈希码及实例特征的特征融合方法过程如下：在车辆图像特征提取阶段，首先，通过softmax激活函数将阈值限制在[0,1]之间；然后，通过分段阈值函数来促进二进制哈希码的输出，使用分段学习和编码策略减少哈希码间的冗余性来提高特征鲁棒性；最后，通过特征融合的方式将分段学习来的哈希码进行融合最终得到车辆特征分段紧凑哈希码；对于车辆的实例特征，实现方法是：分别从conv2_x到conv5_x共享堆叠卷积每个模块的最后一个单元结合RPN网络的输出，添加金字塔池化层和向量扁平层以适应不同尺寸的卷积特征图输入，同时将卷积三维特征扁平化为一维特征向量，该向量称为车辆的实例特征；最后，将车辆分段紧凑哈希...

【专利技术属性】
技术研发人员：汤一平，温晓岳，柳展，张文广，樊锦祥，
申请(专利权)人：银江股份有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人