基于AdaRank的深度特征和传统特征的集成方法技术

技术编号:16457092 阅读:73 留言:0更新日期:2017-10-25 21:15
本发明专利技术涉及一种基于AdaRank的深度特征和传统特征的集成方法,其主要技术特点是:将图像数据进行分割,针对不同部分分别构造并训练深度卷及神经网络,用以获得深度特征;从行人再识别数据中提取传统特征,包括LOMO特征、ELF6特征、Hog3D特征;选取如下三种度量学习方法:KISSME、kLFDA和LMNN;将所有特征与三种度量学习方法进行组合张成笛卡尔乘积,得到一系列弱排序器;利用AdaRank算法,对弱排序器进行集成学习,最终得到强排序器。本发明专利技术设计合理,结合了深度学习、多特征、度量学习、集成学习,通过构造“弱排序器”并进行集成学习,使得系统的整体性能远远高于单一特征和单一度量算法,使得系统整体匹配率大大提升,获得了很好的性能。

Integration method of depth feature and traditional feature based on AdaRank

The invention relates to a method for depth integrated features of AdaRank and traditional features based on the main technical features are: the image data segmentation, according to different parts of structure and training volume and depth of the neural network, used to obtain depth characteristics; from the pedestrian recognition data extracted from traditional features, including LOMO features, ELF6 Hog3D features and characteristics; select the following three types: KISSME, metric learning method of kLFDA and LMNN; all the characteristics and three kinds of measure learning method combined a Chengdi Carle product, get a series of weak ordering; using AdaRank algorithm, integrated learning of weak ordering, finally get the strong sorting device. The invention has reasonable design, a combination of deep learning and multi feature, metric learning and ensemble learning, through the construction of \weak ordering\ and integrated learning, the overall performance of the system is much higher than that of single feature and single measurement algorithm, the overall system matching rate greatly enhance, obtained good performance.

【技术实现步骤摘要】
基于AdaRank的深度特征和传统特征的集成方法
本专利技术属于计算机视觉识别
,尤其是一种基于AdaRank的深度特征和传统特征的集成方法。
技术介绍
随着监控范围的增大,监控数据呈现爆炸式增长。依靠人眼识别监控画面中的行人身份显然十分低效,行人再识别技术的任务便是依靠计算机视觉技术解决不重叠监控视野中行人身份匹配的问题。现有行人再识别算法主要分为两类,一类是传统方法,由特征提取和度量学习两个步骤组成。在特征提取阶段,算法根据数据的特点挖掘有用信息并组织成特征,该特征需要具备描述能力、区分能力和鲁棒性。在度量学习阶段,算法将原有的特征空间进行线性或非线性变换,将特征映射到新的空间中,使得在这个空间中同类样本之间距离较小而不同类样本之间距离较大。另一类是基于深度学习的方法,深度学习是近年来的热门方向,它在计算机视觉领域表现出强大的性能。由于在行人再识别任务中需要比较两个样本之间的相似度,因此用于这一任务的深度网络多数采用了孪生网络结构,即由两条共享参数的分支构成。一对样本输入网络后进行一系列卷积、池化等操作,在网络的末端将两个分支的输出结果进行比较,得出两个样本的相似度。在深度学习方法中,网络末端的输出可以视为网络计算得出的特征,即深度特征。传统特征和深度特征在性能上各有优势。传统特征由算法分析得出,内部原理清晰,可以根据具体应用场景进行适当的优化。深度特征由深度网络自主学习得出,能够提取到算法无法分析得到的特征。因此,如何将上述特征进行充分利用以提高整体匹配率是目前迫切要求解决的问题。
技术实现思路
本专利技术的目地在于克服现有技术的不足,提出一种设计合理、匹配率高且稳定性强的基于AdaRank的深度特征和传统特征的集成方法。本专利技术解决其技术问题是采取以下技术方案实现的:一种基于AdaRank的深度特征和传统特征的集成方法,包括以下步骤:步骤1、将图像数据进行分割,针对不同部分分别构造并训练深度卷及神经网络,用以获得深度特征;步骤2、从行人再识别数据中提取传统特征,包括LOMO特征、ELF6特征、Hog3D特征;步骤3、选取如下三种度量学习方法:KISSME、kLFDA和LMNN;步骤4、将所有特征与三种度量学习方法进行组合张成笛卡尔乘积,得到一系列弱排序器;步骤5、利用AdaRank算法,对弱排序器进行集成学习,最终得到强排序器。所述步骤1的具体实现方法为:根据图像特点对数据进行分割,分割依据是行人的不同身体部位;根据头部、躯干、腿部的原则,每张图片被分割为大小不等的三部分作为三种不同的训练数据,同时整体图像作为一类数据;针对这四种不同数据,分别构造四个结构略有差异的深度卷积神经网络,该训练神经网络时采用了余弦距离作为样本相似度的度量以及三重损失作为损失函数,该余弦距离定义如下:其中B1和B2是神经网络全连接层的输出;设有一对图像序列集,P=(p1,p2,...,pm)是参考集,其中的pi是参考集的第i个样本;G=(g1,g2,...,gn)是备选集,其中的gj是备选集的第j个样本,Sij表示pi和gj之间的余弦距离,对于pi来说,正向损失指同类样本之间距离过大造成的损失,定义如下:负向损失指不同类样本之间距离过小造成的损失,定义如下:上面两个式子中,Ik表示样本k的身份,Kp和Kn分别表示同类样本对和不同类样本对的数量;损失函数的最终形式如下:Ji=Ji-pos+λJi-neg其中,λ是一个用来平衡两种损失的参数。所述LOMO特征的提取方法为:首先垂直方向将图像分为水平的条状区域,将每个区域进一步分为小块,对于每个小块进行直方图特征提取,具体特征包括HSV颜色域的直方图以及SILTP纹理特征直方图;得到区域的所有直方图后,对每个直方取最大值,得到该区域的直方特征;最后将每张图的所有区域所得特征进行拼接,即得到该图像的LOMO特征。所述Hog3D特征的提取方法为:HOG特征是一种经典的梯度特征,其图像中像素点(x,y)的梯度为:Gx(x,y)=H(x+1,y)-H(x-1,y)Gy(x,y)=H(x,y+1)-H(x,y+1)上式中Gx(x,y)、Gy(x,y)、H(x,y)分别表示像素点(x,y)处的水平方向梯度、垂直方向梯度和像素值;该点处的梯度幅值和方向分别为:HOG特征将梯度映射到平面的方向块,Hog3D特征将梯度映射到空间中的正20面体。所述ELF6特征为融合特征,包括29个特征通道,其中8个特征通道用来描述颜色信息,21个用来描述纹理特征。所述强排序器为弱排序器的线性组合。本专利技术的优点和积极效果是:本专利技术设计合理,其采用一个集成模型将传统特征和深度特征进充分结合并采用三种不同度量学习算法,通过构造“弱排序器”并进行集成学习,使得系统的整体性能远远高于单一特征和单一度量算法,使得系统整体匹配率大大提升,获得了很好的性能,本专利技术在公开的数据库上进行了测试,实验表明提出的方法优于目前其他的行人再识别算法。附图说明图1是本专利技术的整体系统的流程图;图2是本专利技术构造的深度卷及神经网络结构示意图;图3a至图3f是本专利技术的系统不同部分对系统整体性能的贡献分析图。具体实施方式以下结合附图对本专利技术实施例做进一步详述。一种基于AdaRank的深度特征和传统特征的集成方法,如图1所示,包括以下步骤:步骤1、将图像数据进行分割,针对不同部分分别构造并训练深度卷及神经网络,用以获得深度特征。具体实现方法如下:根据图像特点对数据进行分割,分割依据是行人的不同身体部位。根据头部、躯干、腿部的原则,每张图片被分割为大小不等的三部分,作为三种不同的训练数据,同时整体图像也作为一类数据。针对这四种不同数据,本方法构造了四个结构略有差异的深度卷积神经网络。训练神经网络时采用了余弦距离作为样本相似度的度量以及三重损失作为损失函数。余弦距离定义如下:其中B1和B2是神经网络全连接层的输出。设有一对图像序列集,P=(p1,p2,...,pm)是参考集,其中的pi是参考集的第i个样本。G=(g1,g2,...,gn)是备选集,其中的gj是备选集的第j个样本。Sij表示pi和gj之间的余弦距离。对于pi来说,正向损失指同类样本之间距离过大造成的损失,定义如下:负向损失指不同类样本之间距离过小造成的损失,定义如下:上面两个式子中,Ik表示样本k的身份,Kp和Kn分别表示同类样本对和不同类样本对的数量。损失函数的最终形式如下:Ji=Ji-pos+λJi-neg其中λ是一个用来平衡两种损失的参数。λ较小时正向损失占比重较大,λ较大时负向损失占比重较大。步骤2、从行人再识别数据中提取传统特征,提取的特征有LOMO特征、ELF6特征、Hog3D特征。具体的特征提取方法如下:(1)在提取LOMO特征时,首先垂直方向将图像分为水平的条状区域。将每个区域进一步分为小块,对于每个小块进行直方图特征提取。具体特征包括HSV颜色域的直方图以及SILTP纹理特征直方图。得到区域的所有直方图后,对每个直方取最大值,得到该区域的直方特征。最后将每张图的所有区域所得特征进行拼接,即得到该图像的LOMO特征。LOMO特征描述了水平方向上的最大事件,对视角变化等问题有很强的鲁棒性。(2)HOG特征是一种经典的梯度特征。梯度特征不仅能够捕获轮廓,人影和一些纹理信本文档来自技高网...
基于AdaRank的深度特征和传统特征的集成方法

【技术保护点】
一种基于AdaRank的深度特征和传统特征的集成方法,其特征在于包括以下步骤:步骤1、将图像数据进行分割,针对不同部分分别构造并训练深度卷及神经网络,用以获得深度特征;步骤2、从行人再识别数据中提取传统特征,包括LOMO特征、ELF6特征、Hog3D特征;步骤3、选取如下三种度量学习方法:KISSME、kLFDA和LMNN;步骤4、将所有特征与三种度量学习方法进行组合张成笛卡尔乘积,得到一系列弱排序器;步骤5、利用AdaRank算法,对弱排序器进行集成学习,最终得到强排序器。

【技术特征摘要】
1.一种基于AdaRank的深度特征和传统特征的集成方法,其特征在于包括以下步骤:步骤1、将图像数据进行分割,针对不同部分分别构造并训练深度卷及神经网络,用以获得深度特征;步骤2、从行人再识别数据中提取传统特征,包括LOMO特征、ELF6特征、Hog3D特征;步骤3、选取如下三种度量学习方法:KISSME、kLFDA和LMNN;步骤4、将所有特征与三种度量学习方法进行组合张成笛卡尔乘积,得到一系列弱排序器;步骤5、利用AdaRank算法,对弱排序器进行集成学习,最终得到强排序器。2.根据权利要求1所述的基于AdaRank的深度特征和传统特征的集成方法,其特征在于:所述步骤1的具体实现方法为:根据图像特点对数据进行分割,分割依据是行人的不同身体部位;根据头部、躯干、腿部的原则,每张图片被分割为大小不等的三部分作为三种不同的训练数据,同时整体图像作为一类数据;针对这四种不同数据,分别构造四个结构略有差异的深度卷积神经网络,该训练神经网络时采用了余弦距离作为样本相似度的度量以及三重损失作为损失函数,该余弦距离定义如下:其中B1和B2是神经网络全连接层的输出;设有一对图像序列集,P=(p1,p2,...,pm)是参考集,其中的pi是参考集的第i个样本;G=(g1,g2,...,gn)是备选集,其中的gj是备选集的第j个样本,Sij表示pi和gj之间的余弦距离,对于pi来说,正向损失指同类样本之间距离过大造成的损失,定义如下:负向损失指不同类样本之间距离过小造成的损失,定义如下:

【专利技术属性】
技术研发人员:郑苏桐郭晓强李小雨姜竹青门爱东
申请(专利权)人:国家新闻出版广电总局广播科学研究院北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1