基于孔洞卷积与注意力学习机制的行人再识别方法技术

技术编号：21185223 阅读：84 留言：0更新日期：2019-05-22 15:50

本发明专利技术公开了一种基于孔洞卷积与注意力学习机制的行人再识别方法，用于解决现有行人再识别方法实用性差的技术问题。技术方案是首先设计基于孔洞卷积的瓶颈模块，并将多个瓶颈模块串联组成主干网络；对主干网络进行预训练，得到预训练模型；在主干网络的不同层次提取注意力特征图，并限制多层注意力特征图一致，自主学习不同层次注意力特征；采用交叉熵损失函数、三元组损失函数以及注意力特征图约束损失函数对网络进行训练；利用主干网络直接提取最终的特征，并在行人检索库中搜索与待搜索行人特征距离最小的行人图片，将身份赋予待搜索行人，完成再识别过程。本发明专利技术将卷积神经网络与注意力学习机制相结合，能够精确进行行人再识别，实用性好。

Pedestrian Recognition Based on Hole Convolution and Attention Learning Mechanism

The invention discloses a pedestrian recognition method based on hole convolution and attention learning mechanism, which is used to solve the technical problem of poor practicability of the existing pedestrian recognition method. The technical scheme is to design the bottleneck module based on hole convolution, and connect several bottleneck modules in series to form the backbone network; pre-train the backbone network to get the pre-training model; extract the attention feature maps at different levels of the backbone network, and restrict the consistency of multi-layer attention feature maps, and autonomously learn different levels of attention features; adopt cross-entropy loss function and ternary. Group loss function and attention feature map constraint loss function are used to train the network; the final features are extracted directly from the backbone network, and pedestrian images with the smallest distance between pedestrian features to be searched are searched in the pedestrian retrieval database, and the identity of pedestrians to be searched is given to complete the re-recognition process. The invention combines convolution neural network with attention learning mechanism, can accurately recognize pedestrians, and has good practicability.

全部详细技术资料下载

【技术实现步骤摘要】
基于孔洞卷积与注意力学习机制的行人再识别方法
本专利技术涉及一种行人再识别方法，特别涉及一种基于孔洞卷积与注意力学习机制的行人再识别方法。
技术介绍
行人再识别是指在不同摄像头场景下识别出行人身份的技术，是视频监控分析技术中非常重要的一部分。然而由于监控视频比较复杂，受到剧烈变化的光照、天气、视角变换、行人姿态、遮挡等因素的影响，以及成像设备分辨率差的影响，使得在不同摄像头下识别出同一行人比较困难。随着深度学习在图像分类、目标识别等多个计算机视觉领域取得重大突破。将深度学习应用在行人再识别上能够很好地处理上述问题。一般来说，深度学习的行人再识别算法主要包含以下几个步骤：步骤一、对行人图片进行预处理；步骤二、利用交叉熵损失函数将行人再识别对深度卷积神经网络进行训练；步骤三、使用训练好的网络提取待搜索行人与查询库中的行人特征；步骤四、计算待搜索行人特征与检索库行人特征间的距离，并排序；步骤五、将距离最小的检索库行人的身份赋予待查询行人，再识别完成。当前基于深度学习的行人再识别方法主要是通过利用深度卷积神经网络与设计损失函数进行行人再识别。深度卷积神经网络通过不断堆叠卷积层、激活函数层、池化层、全连接层等提取行人图片特征，卷积层中的卷积核根据场景进行调整，以适应复杂环境。通过反向传播，损失函数能够指导网络学习在复杂场景下更加鲁棒、更加具有辨别力的特征。利用上述训练的网络对待查找图片和检索库中所有图片提取特征，并计算特征之间的距离，并认为距离最小的检索图片中行人的身份为待查找图片中行人的身份。Li等人在文献“D.Li,X.Chen,Z.Zhang,K.Huang,...

【技术保护点】
1.一种基于孔洞卷积与注意力学习机制的行人再识别方法，其特征在于包括以下步骤：步骤一、设计基于孔洞卷积的瓶颈模块，将多个瓶颈模块串联组成主干网络；步骤二、使用注意力特征图提取模块，根据注意力特征图公式：

【技术特征摘要】
1.一种基于孔洞卷积与注意力学习机制的行人再识别方法，其特征在于包括以下步骤：步骤一、设计基于孔洞卷积的瓶颈模块，将多个瓶颈模块串联组成主干网络；步骤二、使用注意力特征图提取模块，根据注意力特征图公式：提取注意力特征图；其中，input为输入特征，atti,j代表注意力特征图上的(i,j)点的数值，i,j为特征(i,j)点的数值，1≤i≤H，1≤j≤W，H，W分别为输入特征的高和宽，k为特征的一个通道，1≤k≤C，C为特征的通道数；将特征在通道上进行平均，得到注意力特征图；步骤三、对主干网络进行训练；训练采用随机梯度下降法，对分类损失函数、三元组损失函数以及注意力特征图约束损失函数进行优化；分类损失函数公式如下：Lcls＝-logpu，其中，u是真实类别标签，N为类别数目；三元组损失函数公式如下：Ltrip＝...

【专利技术属性】
技术研发人员：袁媛，王琦，蒋旻悦，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人