一种基于投影矩阵约束结合判别字典学习的行人再识别方法技术

技术编号:18895328 阅读:29 留言:0更新日期:2018-09-08 11:21
本发明专利技术涉及一种基于投影矩阵约束结合判别字典学习的行人再识别方法,属于数字图像识别技术领域。首先准备多个视角下的摄像头采集到的图片,进行特征提取,以其作为训练样本。其次构建字典学习算法模型,并以不同视角下的投影矩阵作为模型约束,以提升模型辨别不同行人的性能。通过迭代求解此模型,可以得到行人训练样本中的稀疏编码,最后,以此编码进行相似性匹配,匹配方法我们采用角度相似性和欧氏距离,分别赋予它俩不同的权重。通过以上稀疏编码找到的不同视角下的同一行人图片,其余弦乘积对比其他行人的乘积,其数值最大,即匹配正确,否则匹配错误,本发明专利技术方法实现多个数据集在不同背景下的行人再识别的匹配,提升行人辨别性能。

A method of pedestrian recognition based on projection matrix constraint and discriminant dictionary learning

The invention relates to a pedestrian recognition method based on projection matrix constraint and discriminant dictionary learning, belonging to the technical field of digital image recognition. Firstly, the images captured by multi-view cameras are prepared for feature extraction, which is used as training samples. Secondly, the dictionary learning algorithm model is constructed, and the projection matrix from different perspectives is used as model constraints to improve the performance of the model to distinguish different pedestrians. By solving this model iteratively, sparse coding in pedestrian training samples can be obtained. Finally, similarity matching can be carried out by this coding. Angle similarity and Euclidean distance are used to give them different weights. The same pedestrian picture from different perspectives found by the sparse coding above, and the product of other strings is compared with the product of other pedestrians, and the value is the largest, that is, the matching is correct, otherwise the matching is wrong. The method of the invention realizes the matching of pedestrian recognition of multiple data sets in different backgrounds, and improves the performance of pedestrian discrimination.

【技术实现步骤摘要】
一种基于投影矩阵约束结合判别字典学习的行人再识别方法
本专利技术涉及一种基于投影矩阵约束结合判别字典学习的行人再识别方法,属于数字图像识别

技术介绍
视频监控在维持社会稳定,公共安全,犯罪调查以及其他领域有着举足轻重的地位。行人再识别就是对同一人,他们出现在不同区域的监控镜头,从这些不同地区的监控视频中匹配到我们想找的这个人。这样的技术可以广泛的应用在再识别、跟踪和寻人。尽管这项技术在科研人员中获得了越来越高的重视,但仍然面临行人在视频中不同的姿势变化和高照,以及在遮照,或在拥挤的公共场所中面临挑战。随着科技的发展,在道路,社区都遍布着监控摄像头,但是这些视频的处理仍然需要人工来处理,所以通过机器学习来识别视频中出现的失踪人口和犯罪嫌疑人就变的非常重要。如此,由机器智能来甄别行人,受到了研究者的广泛关注,并提出了许多有效的识别方法。通过大量的文献检索,传统的采用底层特征进行行人再识别的方法,所提取的特征直方图如颜色直方图,纹理特征直方图,形状特征直方图以及SIFT特征,大多数的方法是将几种特征组合而成,以弥补单个特征表达的不足的缺点。所以研究者从学习模型入手来解决因受光照和姿态变化导致匹配不准的难题。模型学习方法中,基于特征学习和度量学习是最具代表性的。通常,前者关注于行人的特征设计,很多的研究者为此投入了大量的精力和心血,为了能设计出不受姿态和环境的变化的特征,很多研究者做了在此方面大量的努力。除了从特征上研发出具有鲁棒性的特征,一些模型为了解决这些问题应运而生。如利用稀疏表示方法的得出的特征能稳定的对行人特征表达,而受到研究者的广泛关注。在这类方法中,具有辨别能力的的字典和具有抗视角变换的模型是影响最终对行人匹配效果的重要因素。而实现这样的效果,通常实现字典学习的判别效果通过添加适当的正则项来实现。
技术实现思路
本专利技术要解决的技术问题是提供一种基于投影矩阵约束结合判别字典学习的行人再识别方法,用以解决现有技术因光照,姿态变化导致的行人匹配困难的问题。本专利技术的技术方案是:一种基于投影矩阵约束结合判别字典学习的行人再识别方法,构建一种学习模型,使其可以匹配属于同一行人在多个摄像头下的视角图片,首先准备多个视角下的摄像头采集到的图片,进行特征提取,以其作为训练样本,其次构建字典学习算法模型,并以不同视角下的投影矩阵作为模型约束,以提升模型辨别不同行人的性能,然后凭借训练样本和模型,迭代求解模型参数,可以得到行人训练样本中的稀疏编码,以此编码进行相似性匹配,匹配方法我们采用角度相似性和欧氏距离,分别赋予它俩不同的权重,最后通过每张图片的稀疏编码找到不同视角下的同一行人图片。具体包括以下步骤:(1)构建训练样本:从公开数据集上的矩形图像或图片,进行特征提取,然后对特征数据进行降维,降维后的每个图片数据为一个列向量(n×1),作为一个行人一个视角下的训练样本,所有行人在一个视角下的样本数据为(n×m),再以同样的方法得到行人在另一个视角下的特征矩阵,得到分别在两个视角下的(n×m)维的矩阵;(2)构建字典学习算法模型,用训练数据学习模型,并在算法里,引入投影矩阵作为提升字典性能的约束条件,进行迭代以求得最优解,学习模型目标函数如式(1)所示:式(1)中,X=[x1,x2,...,xm]∈Rn×m为特征样本,m为行人的数量,n为特征向量的维度,X为每个特征向量组成的矩阵,其中向量xi为第i个行人的特征向量,D为要学习的字典,P1,P2分别为不同视角下的投影矩阵,R为空间域,||·||F为F范数运算符,||·||2为范数的平方运算符;(3)通过增加两个松弛变量,可以求得式(1)最优解,如式(2)所示:通过交替迭代算法,将其他变量固定,其中稀疏编码S1,S2的解为:S1=(DTD+(β+γ)I-1)(DTX1+βS2+γP1X1)(3)式(3)中,I为单位矩阵,β,γ为超参数,同理可求得S2,另外求解P的目标函数为以下式(4):同理可求P2,字典D通过ADMM算法求解,引入辅助变量A和T,以下式(5)其中μ为超参数,求得D的解如下:其中,I为单位矩阵,其维度与一致,上述所有解均为迭代更新求得;其中,第一次迭代时的X1,X2均为降维后的最初特征,第一次迭代的D初始化随机得到,然后进行式(1)~(6)交替迭代更新,得到最终的P和D;(4)将测试集的特征放入模型中,使用学习后得到的D和P得出测试集行人的稀疏编码,然后进行距离匹配,匹配的距离计算采用角度相似性进行计算,如公式(7)所示:相似度=cos(S1,S2)(7)其中,式(7)cos为角度相似性匹配函数。所述n为提取特征后降维后的维度。所述的特征距离比较是指:(4.1)将测试集中的行人不同视角下的数据分成两组,每组的行人对应顺序相同;(4.2)将测试集中的不同视角下的两组特征,通过字典学习得出稀疏编码后,将第一组的第一张图像的编码与第二组所有图像的特征尽心特征距离比较,得到距离矩阵的第一行数据M1;(4.3)重复步骤4.2直到第一组中的所有行人都与第二组的行人进行了角度距离比较,并得到距离矩阵M1j,M2j,M3j,...Mmj,其中i,j表示第一组中的第个行人与第二组中的第j个行人的特征距离;(4.4)将M的每一行从大到小排序,排在第i位的距离对应的第二组中的图像,即与第一组中该行所对应图像第i匹配的图像,其中排在第一列的是最匹配的图像。本专利技术的有益效果是:1、本专利技术的行人再识别方法对复杂背景及行人姿态变换的鲁棒性效果较好。2、本专利技术针对每个视角下行人的采用相应的投影矩阵,传统方法是仅仅对行人的稀疏编码进行约束,影响匹配效果,本专利技术中同时实现行人图像的特征的分类和约束,以及字典的学习,还能减少耗时,提升行人辨别的性能。3、本专利技术提出的行人再识别方法相比其他方法辨别行人性能明显提升。附图说明图1是本专利技术方法的流程图;图2是本专利技术行人再识别常用的公开数据集中随机抽取的机组待匹配的行人图像;图3是本专利技术与常规方法的CMC比较图;图4是本专利技术CMC数据效果对比图。具体实施方式下面结合附图和具体实施方式,对本专利技术作进一步说明。实施例1:如图1所示,一种基于投影矩阵约束结合判别字典学习的行人再识别方法,构建一种学习模型,使其可以匹配属于同一行人在多个摄像头下的视角图片,首先准备多个视角下的摄像头采集到的图片,进行特征提取,以其作为训练样本,其次构建字典学习算法模型,并以不同视角下的投影矩阵作为模型约束,以提升模型辨别不同行人的性能,然后凭借训练样本和模型,迭代求解模型参数,可以得到行人训练样本中的稀疏编码,以此编码进行相似性匹配,匹配方法我们采用角度相似性和欧氏距离,分别赋予它俩不同的权重,最后通过每张图片的稀疏编码找到不同视角下的同一行人图片。具体包括以下步骤:(1)构建训练样本:从公开数据集上的矩形图像或图片,进行特征提取,然后对特征数据进行降维,降维后的每个图片数据为一个列向量(n×1),作为一个行人一个视角下的训练样本,所有行人在一个视角下的样本数据为(n×m),再以同样的方法得到行人在另一个视角下的特征矩阵,得到分别在两个视角下的(n×m)维的矩阵;(2)构建字典学习算法模型,用训练数据学习模型,并在算法里,引入投影矩阵作为提升字典性能的约束条件,本文档来自技高网
...

【技术保护点】
1.一种基于投影矩阵约束结合判别字典学习的行人再识别方法,其特征在于:构建一种学习模型,使其可以匹配属于同一行人在多个摄像头下的视角图片,首先准备多个视角下的摄像头采集到的图片,进行特征提取,以其作为训练样本,其次构建字典学习算法模型,并以不同视角下的投影矩阵作为模型约束,以提升模型辨别不同行人的性能,然后凭借训练样本和模型,迭代求解模型参数,可以得到行人训练样本中的稀疏编码,以此编码进行相似性匹配,匹配方法我们采用角度相似性和欧氏距离,分别赋予它俩不同的权重,最后通过每张图片的稀疏编码找到不同视角下的同一行人图片。

【技术特征摘要】
1.一种基于投影矩阵约束结合判别字典学习的行人再识别方法,其特征在于:构建一种学习模型,使其可以匹配属于同一行人在多个摄像头下的视角图片,首先准备多个视角下的摄像头采集到的图片,进行特征提取,以其作为训练样本,其次构建字典学习算法模型,并以不同视角下的投影矩阵作为模型约束,以提升模型辨别不同行人的性能,然后凭借训练样本和模型,迭代求解模型参数,可以得到行人训练样本中的稀疏编码,以此编码进行相似性匹配,匹配方法我们采用角度相似性和欧氏距离,分别赋予它俩不同的权重,最后通过每张图片的稀疏编码找到不同视角下的同一行人图片。2.根据权利要求1所述的基于投影矩阵约束结合判别字典学习的行人再识别方法,其特征在于具体包括以下步骤:(1)构建训练样本:从公开数据集上的矩形图像或图片,进行特征提取,然后对特征数据进行降维,降维后的每个图片数据为一个列向量(n×1),作为一个行人一个视角下的训练样本,所有行人在一个视角下的样本数据为(n×m),再以同样的方法得到行人在另一个视角下的特征矩阵,得到分别在两个视角下的(n×m)维的矩阵;(2)构建字典学习算法模型,用训练数据学习模型,并在算法里,引入投影矩阵作为提升字典性能的约束条件,进行迭代以求得最优解,学习模型目标函数如式(1)所示:式(1)中,X=[x1,x2,...,xm]∈Rn×m为特征样本,m为行人的数量,n为特征向量的维度,X为每个特征向量组成的矩阵,其中向量xi为第i个行人的特征向量,D为要学习的字典,P1,P2分别为不同视角下的投影矩阵,R为空间域,||·||F为F范数运算符,||·||2为范数的平方运算符;(3)通过增加两个松弛变量,可以求得式(1)最优解,如式(2)所示:通过交替迭代算法,将其他变量固定,其中稀疏编码S1,S2的解为:S1=(...

【专利技术属性】
技术研发人员:李华锋竹晋廷
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1