一种基于投影矩阵约束结合判别字典学习的行人再识别方法技术

技术编号：18895328 阅读：29 留言：0更新日期：2018-09-08 11:21

本发明专利技术涉及一种基于投影矩阵约束结合判别字典学习的行人再识别方法，属于数字图像识别技术领域。首先准备多个视角下的摄像头采集到的图片，进行特征提取，以其作为训练样本。其次构建字典学习算法模型，并以不同视角下的投影矩阵作为模型约束，以提升模型辨别不同行人的性能。通过迭代求解此模型，可以得到行人训练样本中的稀疏编码，最后，以此编码进行相似性匹配，匹配方法我们采用角度相似性和欧氏距离，分别赋予它俩不同的权重。通过以上稀疏编码找到的不同视角下的同一行人图片，其余弦乘积对比其他行人的乘积，其数值最大，即匹配正确，否则匹配错误，本发明专利技术方法实现多个数据集在不同背景下的行人再识别的匹配，提升行人辨别性能。

A method of pedestrian recognition based on projection matrix constraint and discriminant dictionary learning

The invention relates to a pedestrian recognition method based on projection matrix constraint and discriminant dictionary learning, belonging to the technical field of digital image recognition. Firstly, the images captured by multi-view cameras are prepared for feature extraction, which is used as training samples. Secondly, the dictionary learning algorithm model is constructed, and the projection matrix from different perspectives is used as model constraints to improve the performance of the model to distinguish different pedestrians. By solving this model iteratively, sparse coding in pedestrian training samples can be obtained. Finally, similarity matching can be carried out by this coding. Angle similarity and Euclidean distance are used to give them different weights. The same pedestrian picture from different perspectives found by the sparse coding above, and the product of other strings is compared with the product of other pedestrians, and the value is the largest, that is, the matching is correct, otherwise the matching is wrong. The method of the invention realizes the matching of pedestrian recognition of multiple data sets in different backgrounds, and improves the performance of pedestrian discrimination.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于投影矩阵约束结合判别字典学习的行人再识别方法
本专利技术涉及一种基于投影矩阵约束结合判别字典学习的行人再识别方法，属于数字图像识别

技术介绍
视频监控在维持社会稳定，公共安全，犯罪调查以及其他领域有着举足轻重的地位。行人再识别就是对同一人，他们出现在不同区域的监控镜头，从这些不同地区的监控视频中匹配到我们想找的这个人。这样的技术可以广泛的应用在再识别、跟踪和寻人。尽管这项技术在科研人员中获得了越来越高的重视，但仍然面临行人在视频中不同的姿势变化和高照，以及在遮照，或在拥挤的公共场所中面临挑战。随着科技的发展，在道路，社区都遍布着监控摄像头，但是这些视频的处理仍然需要人工来处理，所以通过机器学习来识别视频中出现的失踪人口和犯罪嫌疑人就变的非常重要。如此，由机器智能来甄别行人，受到了研究者的广泛关注，并提出了许多有效的识别方法。通过大量的文献检索，传统的采用底层特征进行行人再识别的方法，所提取的特征直方图如颜色直方图，纹理特征直方图，形状特征直方图以及SIFT特征，大多数的方法是将几种特征组合而成，以弥补单个特征表达的不足的缺点。所以研究者从学习模型入手来解决因受光照和姿态变化导致匹配不准的难题。模型学习方法中，基于特征学习和度量学习是最具代表性的。通常，前者关注于行人的特征设计，很多的研究者为此投入了大量的精力和心血，为了能设计出不受姿态和环境的变化的特征，很多研究者做了在此方面大量的努力。除了从特征上研发出具有鲁棒性的特征，一些模型为了解决这些问题应运而生。如利用稀疏表示方法的得出的特征能稳定的对行人特征表达，而受到研究者的广泛关注。在这...

【技术保护点】
1.一种基于投影矩阵约束结合判别字典学习的行人再识别方法，其特征在于：构建一种学习模型，使其可以匹配属于同一行人在多个摄像头下的视角图片，首先准备多个视角下的摄像头采集到的图片，进行特征提取，以其作为训练样本，其次构建字典学习算法模型，并以不同视角下的投影矩阵作为模型约束，以提升模型辨别不同行人的性能，然后凭借训练样本和模型，迭代求解模型参数，可以得到行人训练样本中的稀疏编码，以此编码进行相似性匹配，匹配方法我们采用角度相似性和欧氏距离，分别赋予它俩不同的权重，最后通过每张图片的稀疏编码找到不同视角下的同一行人图片。

【技术特征摘要】
1.一种基于投影矩阵约束结合判别字典学习的行人再识别方法，其特征在于：构建一种学习模型，使其可以匹配属于同一行人在多个摄像头下的视角图片，首先准备多个视角下的摄像头采集到的图片，进行特征提取，以其作为训练样本，其次构建字典学习算法模型，并以不同视角下的投影矩阵作为模型约束，以提升模型辨别不同行人的性能，然后凭借训练样本和模型，迭代求解模型参数，可以得到行人训练样本中的稀疏编码，以此编码进行相似性匹配，匹配方法我们采用角度相似性和欧氏距离，分别赋予它俩不同的权重，最后通过每张图片的稀疏编码找到不同视角下的同一行人图片。2.根据权利要求1所述的基于投影矩阵约束结合判别字典学习的行人再识别方法，其特征在于具体包括以下步骤：(1)构建训练样本：从公开数据集上的矩形图像或图片，进行特征提取，然后对特征数据进行降维，降维后的每个图片数据为一个列向量(n×1)，作为一个行人一个视角下的训练样本，所有行人在一个视角下的样本数据为(n×m)，再以同样的方法得到行人在另一个视角下的特征矩阵，得到分别在两个视角下的(n×m)维的矩阵；(2)构建字典学习算法模型，用训练数据学习模型，并在算法里，引入投影矩阵作为提升字典性能的约束条件，进行迭代以求得最优解，学习模型目标函数如式(1)所示：式(1)中，X＝[x1,x2,...,xm]∈Rn×m为特征样本，m为行人的数量，n为特征向量的维度，X为每个特征向量组成的矩阵，其中向量xi为第i个行人的特征向量，D为要学习的字典，P1，P2分别为不同视角下的投影矩阵，R为空间域，||·||F为F范数运算符，||·||2为范数的平方运算符；(3)通过增加两个松弛变量，可以求得式(1)最优解，如式(2)所示：通过交替迭代算法，将其他变量固定，其中稀疏编码S1，S2的解为：S1＝(...

【专利技术属性】
技术研发人员：李华锋，竹晋廷，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：云南,53

全部详细技术资料下载我是这个专利的主人