The invention provides a pedestrian re identification method based on a matched convolution neural network, which mainly solves the problem that the prior art has low identification accuracy in complicated environment and pedestrian posture variation. Its implementation is: 1., construct the convolutional neural network; 2. pedestrians collect pictures, get the training samples; 3. with the training set of matching convolutional neural network training; 4. when the user input to query the pedestrian image, matching the convolutional neural network to calculate the similarity between two images and removed from the known database good use of training; 5. 4 repeated operation, until all the pictures in the database are selected; 6. according to the similarity calculated according to the sequence from big to small of the known database sort will sort the results back to users. The invention can improve the accuracy rate of pedestrian re identification in the complex environment and the changeable pedestrian posture, and can be used in the intelligent monitoring system, the real-time tracking of the characters and the traffic supervision field.
【技术实现步骤摘要】
基于匹配卷积神经网络的行人再识别方法
本专利技术属于图像处理
,特别涉及一种行人再识别的方法,可用于智能视频监控系统、人物实时追踪、交通监管等领域。
技术介绍
计算机视觉中的行人再识别是指将多个不同监控摄像头中出现的行人一一对应起来,在摄像头拍摄的视频帧或图像中查找到某个特定的人。行人再识别技术能够将监控人员从屏幕监视这种繁重低效的重复劳动中解放出来,提高视频监控的效率,推动视频监控的智能化进程。行人再识别在多个领域都有较好的应用前景,但是由于监控视频的清晰度差,视频拍摄角度变化多样,拍摄环境更是繁杂多变,行人行走姿态变化万千等多方面的因素导致行人再识别在目前并没有通用的、准确率较高的解决方案。目前,行人再识别大多都是先对行人图片提取特征,然后利用这些特征来判断两个行人图片是否属于同一身份,或者是利用学习的方法在特征间学习出一个映射,特征的提取一般有两种方法:利用人工构造的特征和利用卷积神经网络学习的特征。其中:利用人工构造的特征来进行行人再识别,主要是提取行人的外貌特征,特别是对衣着服饰等进行分析,然后对提取的特征进行编码,利用编码作为判别依据,这些方法对环境、光照,及图像的拍摄质量要求高,不适用于一般场景。利用卷积神经网络的行人再识别方法,首先使用卷积神经网络学习出特征,然后在特征空间度量其相似性。但是,由于目前的卷积神经网络方法并不能很好的克服图片拍摄环境变化大、角度差异大、行人姿态多变等问题,传统的基于卷积神经网络的方法也没有取得很好的效果。
技术实现思路
本专利技术的目的在于针对上述已有技术的不足,提出了一种基于匹配卷积神经网络的行人再识别方法 ...
【技术保护点】
一种基于匹配卷积神经网络的行人再识别方法,包括:(1)构建匹配卷积神经网络:(1a)建立一个由输入层、第一层、第二层、第三层、第四层、第五层和输出层构成的网络结构,其中输入层有三个图像X
【技术特征摘要】
2015.12.15 CN 20151093913821.一种基于匹配卷积神经网络的行人再识别方法,包括:(1)构建匹配卷积神经网络:(1a)建立一个由输入层、第一层、第二层、第三层、第四层、第五层和输出层构成的网络结构,其中输入层有三个图像Xα,Xp和Xn,输出层是三个向量Vα,Vp和Vn;(1b)在第一层利用相同的卷积核分别对输入的图像Xα,Xp,Xn进行卷积,并对卷积后的结果再经过最大池化操作,得到第一层的三个特征图分别为(1c)用第一层的三个特征图构造出第一层的两个混合特征图,其中,符号表示是特征图对应位置的相加运算,是第一层的第一个混合特征图,是第一层的第二个混合特征图;(1d)在第二层分别对第一层的三个特征图使用相同的卷积核进行卷积操作,并对卷积后的结果再经过最大池化操作,得到的第二层的三个特征图分别为分别对第一层得到的两个混合特征图和使用相同的匹配卷积核进行卷积操作,并对卷积后的结果再经过最大池化操作,得到的第二层的两个卷积特征图分别为和然后按下式构造出第二层的混合特征图和(1e)在第三层分别对第二层得到的三个特征图使用相同的卷积核进行卷积操作,并对卷积后的结果再经过最大池化操作,得到第三层的三个特征图分别为分别对第二层得到的两个混合特征图和使用相同的匹配卷积核进行卷积操作,并对卷积后的结果再经过最大池化操作,得到的第三层的两个卷积特征图分别为和构造出第三层的混合特征图和其中,符号表示特征图对应位置的相减运算;(1f)在第四层对第三层得到的第一个特征图进行卷积操作后得到第四层的第一个特征图对第三层的两个混合特征图和再经过相同的卷积操作运算后得到第四层的第二个和第三个混合特征图和(1g)在第五层中将第四层的三个特征图分别与输出层的三个500维的向量Va,Vp,Vn进行全连接;其中,和Vn进行全连接的权重与和Vp进行全连接的权重相同;(1h)网络的输出层是三个特征向量Va,Vp和Vn,这三个特征向量分别与输入层的三个图像Xa,Xp,Xn一一对应;(2)从视频监控网络系统中收集大量拍摄于不同场景、环境、光照、角度下的行人图片,对这些行人图片进行整理,并将这些行人图片组合成三元组数据Ti,1≤i≤N,N是训练样本的数量,再用这些三元组数据构成训练样本集:D=(T1,T2,…,Ti,…,TN);(3)将训练样本集D输入到匹配卷积神经网络中进行训练,得到...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。