一种基于retinex算法和卷积神经网络的行人再识别方法技术

技术编号:15725124 阅读:858 留言:0更新日期:2017-06-29 12:39
本发明专利技术公开了一种基于retinex算法和卷积神经网络的行人再识别方法,首先提取视频数据库中的视频帧序列,构建卷积神经网络并训练出行人网络模型,利用训练好的网络模型将行人从视频帧序列中检测出来,用retinex算法将检测出的行人进行图像增强,最后将增强后的行人输入卷积神经网络中提取行人不同层次的深度特征,通过卷积神经网络最后一层的softmax分类器进行分类,得到最终匹配相似度。本发明专利技术充分考虑了现实场景中光照变化,阴影覆盖等问题,在识别之前引入retinex增强算法,模仿人类视觉系统,使图像更接近于人眼所看到的样子,有效地提高了识别效果。采用端到端的行人再识别方法,用同一个卷积神经网络将行人检测与行人识别结合在一起,解决了行人标签的对齐问题。

【技术实现步骤摘要】
一种基于retinex算法和卷积神经网络的行人再识别方法
本专利技术属于模式识
,具体涉及一种基于retinex算法和卷积神经网络的行人再识别方法。
技术介绍
行人再识别是计算机视觉领域最近几年研究的热点内容,传统的行人再识别将行人检测和行人识别分开,先使用DPM或ACF算法检测出行人,对检测出的行人包围框加以裁剪用于之后的行人识别,这种方法难以投入现实场景的使用,并且行人检测区域和行人识别区域难以实现完全对齐,导致行人识别低下。行人识别现在一种流行的做法是使用卷积神经网络提取行人对的图片特征进行特征匹配,它采用反向传播算法从大量的数据样本中获得一定的规律,模仿人脑的神经网络,对未知事物做出预测。传统的神经网络具有很强的非线性拟合能力,可以映射任意复杂的非线性关系,具有很强的鲁棒性和记忆能力,利用神经网络提取的低层特征,如颜色纹理空结构特征等,这些特征易于计算并且相对可靠,但是这些底层特征没有较好的语义表达能力,跟行人的外观的关系并不紧密。当出现光照变化以及行人旋转角度变化时,这些特征往往不能很好的表达出行人的特征,从而造成识别时出现偏差。
技术实现思路
本专利技术针对现有技术的不足,提出一种基于retinex算法和卷积神经网络的行人再识别方法,简化了行人识别操作的复杂性,更利于现实场景应用,并且很好地克服了光照视角等多种的因素的影响,大大提高了行人的识别率。为达到上述目的,本专利技术的具体技术方案为一种基于retinex算法和卷积神经网络的行人再识别方法,具体包括以下步骤:步骤101,采集视频图像,截取视频帧;步骤102,训练CNN网络模型,进行行人的检测;步骤103,利用retinex算法对检测出的行人包围框进行图像增强,对图像的Intensity数据进行Retinex处理,然后再把数据根据原始的RGB的比例映射到每个通道,最大程度地减少光照和行人表面反射光的影响;步骤104,提取卷积特征,经过多次卷积和降采样,提取fc6层的特征;步骤105,将从两台摄像机得到的行人特征进行特征匹配,并得出识别率。进一步,上述CNN神经网络中含有两个softMax层,一层用于行人检测时候选区域的预测分类,另一层用于对不同行人进行识别。上述步骤103中,利用retinex算法对检测出的行人进行图像增强,具体包含以下步骤:步骤201,计算输入行人图像的模糊半径I(x,y);步骤201,计算行人图像按某种尺度进行高斯模糊的图像数据L(x,y);步骤203,将以上两个步骤得到的值的对数值相减,得到图像排除光照阴影和反射光后的数据logR(x,y);步骤204,将logR(x,y)量化到0-255的像素值,输出经过增强后的行人图像。上述步骤102和104中,所用的检测和行人特征的提取使用同一个卷积神经网络,用同一个神经网络进行行人的检测与识别,具体为:行人检测部分,所用神经网络采用VGG16模型的前四层卷积层:第一层卷积层C1:设定64个特征平面,卷积核大小为3×3;第一层下采样层S1:设定64个特征平面,池化窗口大小为2×2;第二层卷积层C2:设定128个特征平面,卷积核大小为3×3;第二层下采样层S2:设定128个特征平面,池化窗口大小为2×2;第三层卷积层C3:设定256个特征平面,卷积核大小为3×3;第三层下采样层S3:设定256个特征平面,池化窗口大小为2×2;第四层卷积层C4:设定16个特征平面,卷积核大小为3×3;第四层下采样层S4:设定16个特征平面,池化窗口大小为2×2;Fc5和fc6用于行人识别:Fc5设定4096个特征平面,fc6设定256个特征平面方便进行特征的匹配。上述神经网络使用ROI池化技术进行行人目标的检测,经过神经网络的前四层的卷积和池化之后,将场景图像的特征输入ROIpooling层,获得行人框中的图像特征。上述获得行人框中的图像特征具体包含以下步骤:(1)使用选择性搜索方法获取一帧场景图像中大约2000个候选区域,并自动将这些区域裁剪到227×227,得到统一分辨率的2000个候选区域之后,将2000个候选区域输入到一个预训练的CNN模型,从最后一个全连接层输出4096*1的向量特征;(2)对所有的上述候选区域进行严格的标定,当且仅当一个候选框完全包含参考标准区域且不属于参考标准部分不超过候选框区域的5%时,认为该候选框标定结果为目标,否则为背景;(3)将提取得到的2000个候选区域经过regression回归层特征提取后输入到softmax层中,可以给出特定类别评分结果,得到softmax层对于所有候选区域的评分结果;(4)将一些分数较低的候选区域去掉后,剩下的候选区域中会出现候选框相交的情况,采用非极大值抑制技术,对于相交的两个框或若干个框,找到最能代表最终检测结果的候选框。与现有技术相比,本专利技术的有益效果:1,本专利技术采用端到端的行人再识别方法,将行人检测与行人的识别结合到一起,从而解决了大量的行人图像的标注问题,并且更具有现实意义。对于先进行检测再进行识别而产生的行人目标框对齐的问题也可以有效地避免,因此本专利技术的行人识别率得到了很大的提升。2,本专利技术在行人检测之后引入retinex算法对行人包围框进行行人图像的特征加强,提高了行人特征的语义表达能力,在光照视角变化等因素的影响下体现出较高的识别率。附图说明图1是本专利技术的基于retinex算法和卷积神经网络的行人再识别方法流程图。具体实施方式现结合附图对本专利技术作进一步的详细说明。本专利技术中,神经网络使用ROI池化技术进行行人目标的检测,经过神经网络的前四层的卷积和池化之后,将场景图像的特征输入ROIpooling层,获得行人框中统一的图像特征。具体为:使用选择性搜索(selectivesearch)方法获取一帧场景图像中大约2000个候选区域,并自动将这些区域裁剪到227×227。得到统一分辨率的的2000个候选区域之后,将2000个候选区域输入一个预训练的CNN(ConvolutionNeuralNetwork)模型,从最后一个全连接层输出4096*1的向量特征。对所有的候选区域进行严格的标定,当且仅当一个候选框完全包含groundtruth区域且不属于groundtruth部分不超过候选框区域的5%时认为该候选框标定结果为目标,否则位背景。将提取得到的2000个候选区域经过regression回归层特征提取后输入到softmax层中,可以给出特定类别评分结果。得到softmax层对于所有候选区域的评分结果,将一些分数较低的候选区域去掉后,剩下的候选区域中会出现候选框相交的情况。采用非极大值抑制技术,对于相交的两个框或若干个框,找到最能代表最终检测结果的候选框。本专利技术的流程图如图1所示,以下为一个具体的实施例,其具体步骤依次为:步骤101,采集视频图像,截取视频帧。步骤102,训练CNN网络模型,进行行人的检测。步骤103,利用retinex算法对检测出的行人包围框进行图像增强,对图像的Intensity数据进行Retinex处理,然后再把数据根据原始的RGB的比例映射到每个通道。步骤104,提取卷积特征,经过多次卷积和降采样,提取fc6层的特征。步骤105,将两个摄像机得到的行人特征输入softmax层进行分类,并的出识别率。本文档来自技高网...
一种基于retinex算法和卷积神经网络的行人再识别方法

【技术保护点】
一种基于retinex算法和卷积神经网络的行人再识别方法,其特征在于,具体包括以下步骤:步骤101,采集视频图像,截取视频帧;步骤102,训练CNN网络模型,进行行人的检测;步骤103,利用retinex算法对检测出的行人包围框进行图像增强,对图像的Intensity数据进行Retinex处理,然后再把数据根据原始的RGB的比例映射到每个通道,最大程度地减少光照和行人表面反射光的影响;步骤104,提取卷积特征,经过多次卷积和降采样,提取fc6层的特征;步骤105,将从两台摄像机得到的行人特征进行特征匹配,并得出识别率。

【技术特征摘要】
1.一种基于retinex算法和卷积神经网络的行人再识别方法,其特征在于,具体包括以下步骤:步骤101,采集视频图像,截取视频帧;步骤102,训练CNN网络模型,进行行人的检测;步骤103,利用retinex算法对检测出的行人包围框进行图像增强,对图像的Intensity数据进行Retinex处理,然后再把数据根据原始的RGB的比例映射到每个通道,最大程度地减少光照和行人表面反射光的影响;步骤104,提取卷积特征,经过多次卷积和降采样,提取fc6层的特征;步骤105,将从两台摄像机得到的行人特征进行特征匹配,并得出识别率。2.根据权利要求1所述的基于retinex算法和卷积神经网络的行人再识别方法,其特征在于CNN神经网络中含有两个softMax层,一层用于行人检测时候选区域的预测分类,另一层用于对不同行人进行识别。3.根据权利要求1所述的基于retinex算法和卷积神经网络的行人再识别方法,其特征在于:所述步骤103中,利用retinex算法对检测出的行人进行图像增强,具体包含以下步骤:步骤201,计算输入行人图像的模糊半径I(x,y);步骤201,计算行人图像按某种尺度进行高斯模糊的图像数据L(x,y);步骤203,将以上两个步骤得到的值的对数值相减,得到图像排除光照阴影和反射光后的数据logR(x,y);步骤204,将logR(x,y)量化到0-255的像素值,输出经过增强后的行人图像。4.根据权利要求1所述的基于retinex算法和卷积神经网络的行人再识别方法,其特征在于,所述步骤102和104中,所用的检测和行人特征的提取使用同一个卷积神经网络,用同一个神经网络进行行人的检测与识别,具体为:行人检测部分,所用神经网络采用VGG16模型的前四层卷积层:第一层卷积层C1:设定64个特征平面,卷积核大小为3×3;第一层下采样层S1:设定64个特征平面,池化窗口大小为2...

【专利技术属性】
技术研发人员:韩光段朦李晓飞余小意
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1