一种基于投影变换与字典学习的行人再识别的方法技术

技术编号:21141702 阅读:21 留言:0更新日期:2019-05-18 05:19
本发明专利技术涉及一种基于投影变换与字典学习的行人再识别的方法,属于数字图像识别技术领域。本发明专利技术首先提取训练样本和测试样本的底层视觉特征,将特征映射到低维判别性空间,使同一行人之间特征的歧义性达到最小,不同行人特征的发散性达到最大,再引入不连贯性正则项,使不同行人之间的编码系数尽可能地相互独立。基于字典学习的方法首先根据训练样本图像的特征,学习得到一个具有判别性的字典,然后利用字典的判别性,产生更具表达能力与判别性的编码系数,来代替原始视觉特征进行行人的相似性度量,在测试阶段通过迭代求解不同视角下行人的编码系数,从进行相似性度量。从客观指标上,本发明专利技术的识别率明显的由于其他的传统方法。

A Pedestrian Recognition Method Based on Projection Transform and Dictionary Learning

【技术实现步骤摘要】
一种基于投影变换与字典学习的行人再识别的方法
本专利技术涉及一种基于投影变换与字典学习的行人再识别的方法,属于数字图像识别

技术介绍
随着视频监控系统大量的普及,仅仅依靠人工浏览和研判的方式来实现行人再识别耗费了大量的人力和物力,摄像机网络环境嘈杂、人为无法控制导致很难提升准确率。由于利用计算机视觉技术对跨视角识别指定的人具备快速性、高效性,使得行人重识别技术受到越来越多的关注。在最近这五年里,行人重识别在目标追踪和行为分析[2]等方面有着至关重要的应用。例如,在刑侦工作方面可用于跨视角的嫌疑犯追踪;在商业上,可以判断同一个客户对商场里商品的感兴趣程度。虽然,行人重识别有广阔的应用前景,但在现实生活场景中仍面临着巨大的挑战。因不同摄像机下行人的视角、姿态、光照强度、背景杂波、遮挡等发生显著的变化,这些变化导致同一个人在不同摄像机下外貌特征相差很大,很难判断是否是同一人,而不同的人因行人体型、姿态衣着等外貌特征相似比同一个人在不同的摄像头下更相似,区分开不同的人也极其困难。为了减轻这些变化,传统的方法主要有两种:一种是为行人设计鲁棒性和判别性的描述子,为了区分不同的人。郑等人认为行人在水平方向发生视角变化,在垂直方向上基本稳定不变,因此将行人图片在垂直方向上分成6个条带,再分别每个条带上提取HSV直方图颜色特征和Gabor滤波纹理描述两种特征,串联形成最终的特征向量。度量学习就是使用训练集学习一个度量模型让同类人之间的差异性很小,不同类人之间的差异性很大。Mignon等人通过PCCA(PairwiseConstrainedComponentAnalysis)学习投影矩阵,将行人的特征投影到低维空间,在这个空间里,正样本特征之间的马氏距离小于某个阈值,同时负样本特征之间的马氏距离大于这个阈值。以上两种方法中,利用特征表示的方法直接提取特征进行匹配,不需要训练阶段,但颜色特征严重受光照条件的影响,纹理特征又受图像分辨率的影响,导致很难提取鲁棒性和判别性的特征,从而限制了算法的性能。
技术实现思路
本专利技术要解决的技术问题是提供一种基于投影变换与字典学习的行人再识别的方法,以用于解决光照和姿态的变化,背景杂波、遮挡等导致的行人匹配困难问题。本专利技术的技术方案是:一种基于投影变换与字典学习的行人再识别的方法,包括如下步骤:Step1、构建特征数据在两个视角下的训练样本、测试样本;Step2、构建一种投影变换与字典学习的行人再识别方法的学习模型;Step2.1、将原始的特征投影到低维的判别性空间,使同一行人之间特征的歧义性达到最小,不同行人特征的发散性达到最大;Step2.2、引入不连贯性正则项其中,Pa:a视角下的映射矩阵,pai表示Pa中的第i列,Pb:b视角下的映射矩阵,pbi表示Pb中的第i列,Ca:a视角下的行人编码系数,Cai:为Ca的第i列,Cb:b视角下的行人编码系数,Cbi:为Cb的第i列,D:字典,di表示D中的第i列,α,λ均为大于0的实数,||·||F表示Frobenius范数,||·||2表示l2范数,||·1表示l1范数,||·||2表示范数的平方运算符,T为矩阵的转置,如PT为矩阵P的转置;Step3、迭代求解学习模型中映射矩阵Pa和Pb以及字典D,从而进行相似性度量;Step4、将step1中提取的训练样本特征数据以及Step3求得的投影矩阵和字典求得a,b视角下的编码系数再进行相似性度量,从而进行行人再识别。具体地,所述步骤Step1的具体步骤如下:Step1.1、从公开数据集上PRID2011的图片提取GOG特征;Step1.2、然后对特征数据进行降维,降维后的每张图片的数据为一个列向量(n×1),作为一个行人在一个视角下的样本;所有行人在一个视角下的样本数据为特征矩阵(n×m),n为特征的维数,m为行人的个数;Step1.3、再以同样的方法得到行人在另一个视角下的样本数据特征矩阵,分别得到在两个视角下的特征矩阵,随机选取一半行人特征为训练样本,剩下的一半行人特征和干扰图片特征为测试样本。具体地,所述步骤Step3的具体步骤如下:Step3.1、已知公式1,求解映射矩阵Pa和Pb;其中,Λa为Pa的拉格朗日对偶变量构成的对角矩阵;其中,Λa为Pb的拉格朗日对偶变量构成的对角矩阵;Step3.2、已知公式1,使用ADMM算法迭代求解D,同时引入辅助变量B,T,且D=B,当第t+1次更新后的字典与第t次更新后的字典相差为0.0000001时,即|D(t+1)-Dt|≤0.0000001时,迭代终止;其中,η为实数,取值为0.999。具体地,所述步骤Step4的具体步骤如下:将step1中提取的训练样本特征数据以及Step3求得的投影矩阵和字典求得a,b视角下的编码系数见公式5和6,再利用公式7进行相似性度量,从而进行行人再识别;其中,为两个不同视角编码系数列向量之间的距离,此距离最小时即再识别成功,不同视角编码系数列向量距离最小时编码系数所对应的行人为同一行人,表示编码系数中的第i列,表示编码系数中的第j列。具体地,所述的α,λ的值分别为0.4和0.0005。本专利技术的有益效果是:1、本专利技术的行人再识别方法对复杂背景及行人姿态变换的鲁棒性效果较好。2、本专利技术针对每个视角下行人的采用相应的投影矩阵,将特征投影到判别性低维空间,传统方法是直接使用行人的原始特征学习字典,使学习到字典性能有限,因此本专利技术提出的行人再识别方法相比其他方法辨别行人性能明显提升。附图说明图1为本专利技术的流程图;图2为行人再识别的匹配说明;图3为本专利技术使用的公共数据集PRID2011的行人图像;图4为本专利技术使用的公共数据集PRID2011上的干扰图片。具体实施方式下面结合附图和具体实施例,对本专利技术做进一步的说明。实施例1,如图1-4所示,一种基于投影变换与字典学习的行人再识别的方法,包括如下步骤:Step1、构建特征数据在两个视角下的训练样本、测试样本;Step2、构建一种投影变换与字典学习的行人再识别方法的学习模型;Step2.1、将原始的特征投影到低维的判别性空间,使同一行人之间特征的歧义性达到最小,不同行人特征的发散性达到最大;Step2.2、引入不连贯性正则项其中,Pa:a视角下的映射矩阵,pai表示Pa中的第i列,Pb:b视角下的映射矩阵,pbi表示Pb中的第i列,Ca:a视角下的行人编码系数,Cai:为Ca的第i列,Cb:b视角下的行人编码系数,Cbi:为Cb的第i列,D:字典,di表示D中的第i列,α,λ均为大于0的实数,||·||F表示Frobenius范数,||·||2表示l2范数,||·||1表示l1范数,||·||2表示范数的平方运算符,T为矩阵的转置,如PT为矩阵P的转置;Step3、迭代求解学习模型中映射矩阵Pa和Pb以及字典D,从而进行相似性度量;Step4、将step1中提取的训练样本特征数据以及Step3求得的投影矩阵和字典求得a,b视角下的编码系数再进行相似性度量,从而进行行人再识别。进一步地,所述步骤Step1的具体步骤如下:Step1.1、从公开数据集上PRID2011的图片提取(GaussianOfGaussian)GOG特征;图3为PRID2011数据集上的正样本本文档来自技高网
...

【技术保护点】
1.一种基于投影变换与字典学习的行人再识别的方法,其特征在于:包括如下步骤:Step1、构建特征数据在两个视角下的训练样本、测试样本;Step2、构建一种投影变换与字典学习的行人再识别方法的学习模型;Step2.1、将原始的特征投影到低维的判别性空间,使同一行人之间特征的歧义性达到最小,不同行人特征的发散性达到最大;Step2.2、引入不连贯性正则项

【技术特征摘要】
1.一种基于投影变换与字典学习的行人再识别的方法,其特征在于:包括如下步骤:Step1、构建特征数据在两个视角下的训练样本、测试样本;Step2、构建一种投影变换与字典学习的行人再识别方法的学习模型;Step2.1、将原始的特征投影到低维的判别性空间,使同一行人之间特征的歧义性达到最小,不同行人特征的发散性达到最大;Step2.2、引入不连贯性正则项其中,Pa:a视角下的映射矩阵,pai表示Pa中的第i列,Pb:b视角下的映射矩阵,pbi表示Pb中的第i列,Ca:a视角下的行人编码系数,Cai:为Ca的第i列,Cb:b视角下的行人编码系数,Cbi:为Cb的第i列,D:字典,di表示D中的第i列,α,λ均为大于0的实数,||·||F表示Frobenius范数,||·2表示l2范数,||·||1表示l1范数,||·||2表示范数的平方运算符,T为矩阵的转置,如PT为矩阵P的转置;Step3、迭代求解学习模型中映射矩阵Pa和Pb以及字典D,从而进行相似性度量;Step4、将step1中提取的训练样本特征数据以及Step3求得的投影矩阵和字典求得a,b视角下的编码系数再进行相似性度量,从而进行行人再识别。2.根据权利要求1所述的一种基于投影变换与字典学习的行人再识别的方法,其特征在于:所述步骤Step1的具体步骤如下:Step1.1、从公开数据集上PRID2011的图片提取GOG特征;Step1.2、然后对特征数据进行降维,降维后的每张图片的数据为一个列向量(n×1),作为一个行人在一个视角下的样本;所有行人在一个视角下的样本数...

【专利技术属性】
技术研发人员:周维燕唐剑于晓雨
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1