当前位置: 首页 > 专利查询>中山大学专利>正文

一种基于正样本平衡约束的深度行人再标识方法技术

技术编号:16529320 阅读:205 留言:0更新日期:2017-11-09 21:11
本发明专利技术提供一种基于正样本平衡约束的深度行人再标识方法,该方法使用的残差网网络结构简洁并且得到广泛应用,足够深的网络结构增强了特征表达能力,并且不需要对网络结构进行特别设计;发现用残差网分类器进行图像特征提取,行人再标识的准确率便可以高于大部分的精心设计的方法;相比于二元组损失和三元组损失的方法,提升结构损失不需要特意生成有效的样本便可以达到类似的效果,并且利用整体的分布信息,学习到的梯度方向更加稳健有效;在提升结构损失的基础上,增加了正样本平衡约束,不仅可以控制正样本对的距离,并且可以平衡正样本对距离和负样本对距离的梯度,使得算法更容易训练以及提升算法性能。

【技术实现步骤摘要】
一种基于正样本平衡约束的深度行人再标识方法
本专利技术涉及深度学习与行人再标识领域,更具体地,涉及一种基于正样本平衡约束的深度行人再标识方法。
技术介绍
这些年来,模式识别、机器学习、计算机视觉研究领域取得了令人印象深刻的进步。这些进步吸引了视频监控、法律安全行业的注意,同时该行业也对这些智能算法以及智能系统的需求也在不断地增加。在安全行业的不断发展的作用下,用于人脸监测、指纹监测、其他生物特征监测以及人和城市环境的智能监测工具得到了广泛的应用。这些工具收集了大量的数据,通常以图像或者视频的形式存在,为机器学习领域带来了新的研究课题,而在近年来引起学术界较大兴趣的课题则是行人再标识。总的来说,处理行人再标识问题有两类方法,分别是传统方法和深度学习方法。传统方法一般而言需要设计或者学习出稳健的并且具有判别性的特征,大多数是浅层模型,特征表达能力有限;而深度学习网络可以通过学习权重而达到自动学习到需要观察哪一些有效的特征,不需要如传统的方法需要人工设计特征,最近两三年来,开始越来越多的研究者用深度学习方法去解决行人再标识问题,并且取了不错的进展。不过,现在的深度学习方法大多利用数据局部分布的信息,并且还是使用较少的隐藏层,网络相对不深,因此算法性能上还有明显提升空间。
技术实现思路
本专利技术提供一种提升了特征表达能力的基于正样本平衡约束的深度行人再标识方法。为了达到上述技术效果,本专利技术的技术方案如下:一种基于正样本平衡约束的深度行人再标识方法,包括以下步骤:S1:输入数据训练数据集其中,N是样本数量,d是图像像素,c是训练集中不同行人的数量,xi是d维的列向量,yi=[yi1,yi2,yi3,…,yic]T是c维的列向量,其中的元素等于1或0,并且X=[x1,x2,x3,…,xN],X是d行N列的矩阵;S2:使用softmax分类模型对网络进行预训练;S3:使用基于正样本平衡约束的提升结构损失对网络进行训练;S4:对测试样本图像进行特征提取;S5:利用得到的特征对测试样本进行最近邻KNN分类进而得到再标识结果。进一步地,所述步骤S2的具体过程是:设置网络的训练学习率η和epoch最大次数T,并且使用softmax分类模型对网络参数W进行预训练,训练的方法为反向传播算法,具体的步骤如下所示:首先初始化网络参数W;若当前epoch次数少于T,则生成迷你批数据然后把输入到网络进行向前传播计算,计算得到该次迭代的损失函数值然后根据进行向后传播计算,计算梯度最后进行网络参数更新网络参数根据该规则进行不断更新,直到epoch次数等于T。进一步地,所述步骤S3的具体过程是:把深度网络的损失函数从交叉熵换为提升结构损失,对于训练数据集为定义代表训练样本中正样本对的集合,而则代表负样本对的集合,正样本对距离为Di,j,而负样本对距离为Di,k和Di,l是控制负样本对距离的常数参数;把深度网络的损失函数从交叉熵换为提升结构损失,其具体公式如下:其中:Di,j=||Ψ(xi)-Ψ(xj)||2由于此损失函数不平滑,容易在训练过程中陷入一个表现很糟糕的局部极值点,另外该函数求梯度也不方便,通过最优化它的一个光滑的上界来间接优化原函数,结构损失函数指该上界,其中增加两个常数参数β和λ,前者控制正样本对距离,后者平衡梯度:再设置网络的训练学习率η和epoch最大次数T,以及三个常数参数α、β、λ,使用反向传播算法对深度网络进行训练,最终得到优化好的网络参数W。进一步地,所述步骤S4的具体过程是:对测试样本图像进行特征提取,测试样本图像由查询集和测试集行人再标识的目的是给定一个查询集样本xiq,要在测试集中检索出相同行人的图像,设Ψ(·)代表深度卷积网络,则对查询集和测试集提取深度特征Ψ(xiq)和Ψ(xit)。进一步地,所述步骤S5的具体过程是:利用得到的Ψ(xiq)和Ψ(xit),对查询集中的每个样本在测试集中进行检索,返回的包括若干图像的检索列表即为在识别结果。与现有技术相比,本专利技术技术方案的有益效果是:使用的残差网网络结构简洁并且得到广泛应用,足够深的网络结构增强了特征表达能力,并且不需要对网络结构进行特别设计;发现用残差网分类器进行图像特征提取,行人再标识的准确率便可以高于大部分的精心设计的方法;相比于二元组损失和三元组损失的方法,提升结构损失不需要特意生成有效的样本便可以达到类似的效果,并且利用整体的分布信息,学习到的梯度方向更加稳健有效。附图说明图1为本专利技术流程图;图2为50层的残差网络结构示意图;图3(a)为二元对抗损失的情况示意图;图3(b)为三元对抗损失的情况示意图;图3(c)为提升结构损失示意图。具体实施方式附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。下面结合附图和实施例对本专利技术的技术方案做进一步的说明。实施例1如图1所示,一种基于正样本平衡约束的深度行人再标识方法,包括以下步骤:S1:输入数据训练数据集其中,N是样本数量,d是图像像素,c是训练集中不同行人的数量,xi是d维的列向量,yi=[yi1,yi2,yi3,…,yic]T是c维的列向量,其中的元素等于1或0,并且X=[x1,x2,x3,…,xN],X是d行N列的矩阵;S2:使用softmax分类模型对网络进行预训练;S3:使用提升结构损失对网络进行训练;S4:对测试样本图像进行特征提取;S5:利用得到的特征对测试样本进行最近邻KNN分类进而得到再标识结果。步骤S2的具体过程是:设置网络的训练学习率η和epoch最大次数T,并且使用softmax分类模型对网络参数W进行预训练,训练的方法为反向传播算法,具体的步骤如下所示(如图2所示):首先初始化网络参数W;若当前epoch次数少于T,则生成迷你批数据然后把输入到网络进行向前传播计算,计算得到该次迭代的损失函数值然后根据进行向后传播计算,计算梯度最后进行网络参数更新网络参数根据该规则进行不断更新,直到epoch次数等于T。首先初始化网络参数W;若当前epoch次数少于T,则生成迷你批数据然后把输入到网络进行向前传播计算,计算得到该次迭代的损失函数值然后根据进行向后传播计算,计算梯度最后进行网络参数更新网络参数根据该规则进行不断更新,直到epoch次数等于T。步骤S3的具体过程是:如图3(a)-(c)所示,把深度网络的损失函数从交叉熵换为提升结构损失,对于训练数据集为定义代表训练样本中正样本对的集合,而则代表负样本对的集合,正样本对距离为Di,j,而负样本对距离为Di,k和Di,l是控制负样本对距离的常数参数;把深度网络的损失函数从交叉熵换为提升结构损失,其具体公式如下:其中:Di,j=||Ψ(xi)-Ψ(xj)||2由于此损失函数不平滑,容易在训练过程中陷入一个表现很糟糕的局部极值点,另外该函数求梯度也不方便,通过最优化它的一个光滑的上界来间接优化原函数,结构损失函数指该上界,其中增加两个常数参数β和λ,前者控制正样本对距离,后者平衡梯度:再设置网络的训练学习率η和epoch最大次数T,以及三个常数参数α、β、λ,使用反向传播算法对深度网络进行训练,本文档来自技高网...
一种基于正样本平衡约束的深度行人再标识方法

【技术保护点】
一种基于正样本平衡约束的深度行人再标识方法,其特征在于,包括以下步骤:S1:输入数据训练数据集

【技术特征摘要】
1.一种基于正样本平衡约束的深度行人再标识方法,其特征在于,包括以下步骤:S1:输入数据训练数据集其中,N是样本数量,d是图像像素,c是训练集中不同行人的数量,xi是d维的列向量,yi=[yi1,yi2,yi3,…,yic]T是c维的列向量,其中的元素等于1或0,并且X=[x1,x2,x3,…,xN],X是d行N列的矩阵;S2:使用softmax分类模型对网络进行预训练;S3:使用基于正样本平衡约束的提升结构损失对网络进行训练;S4:对测试样本图像进行特征提取;S5:利用得到的特征对测试样本进行最近邻KNN分类进而得到再标识结果。2.根据权利要求1所述的基于正样本平衡约束的深度行人再标识方法,其特征在于,所述步骤S2的具体过程是:设置网络的训练学习率η和epoch最大次数T,并且使用softmax分类模型对网络参数W进行预训练,训练的方法为反向传播算法,具体的步骤如下所示:首先初始化网络参数W;若当前epoch次数少于T,则生成迷你批数据然后把输入到网络进行向前传播计算,计算得到该次迭代的损失函数值然后根据进行向后传播计算,计算梯度最后进行网络参数更新网络参数根据该规则进行不断更新,直到epoch次数等于T。3.根据权利要求2所述的基于正样本平衡约束的深度行人再标识方法,其特征在于,所述步骤S3的具体过程是:把深度网络的损失函数从交叉熵换为...

【专利技术属性】
技术研发人员:黄俊艺任传贤
申请(专利权)人:中山大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1