针对视频数据行人再识别的LOMO3D特征提取方法技术

技术编号:17655707 阅读:34 留言:0更新日期:2018-04-08 08:48
本发明专利技术涉及一种针对视频数据行人再识别的LOMO3D特征提取方法,其技术特点是:将视频数据中的各帧分离出来,组织成图像序列的形式,并分割为一定长度的等长序列;将每个序列水平分割为若干扁平区域,并在这些区域中进一步划分子块,作为直方图统计的最小单位;对于每个子块,统计形成纹理直方图特征和HSV色域下的颜色直方图特征;将每个水平区域中的纹理和颜色直方图特征根据最大化原则进行整合并进行拼合,得到最终的LOMO3D特征描述子。本发明专利技术设计合理,充分利用了图像序列中的时空特征和时间信息,使得特征的描述能力性能远远高于单纯的空间域特征,试验表明本发明专利技术能够使得系统整体匹配率大大提升,优于目前其他的行人再识别算法。

【技术实现步骤摘要】
针对视频数据行人再识别的LOMO3D特征提取方法
本专利技术属于视觉行人再识别
,尤其是一种针对视频数据行人再识别的LOMO3D特征提取方法。
技术介绍
随着监控范围的增大,监控数据呈现爆炸式增长。依靠人眼识别监控画面中的行人身份显然十分低效,行人再识别技术的任务便是依靠计算机视觉技术解决不重叠监控视野中行人身份匹配的问题。行人再识别技术的传统方法主要包括两个步骤,首先对图像/视频进行特征提取,然后通过度量学习得到不同样本的相似度/距离。在特征提取阶段,常用的基础图像特征包括颜色特征、纹理特征、梯度特征等,将这些特征进行融合往往取得优于单一特征的效果。除这些基础特征以外,针对行人再识别技术采用一些高级特征,例如,局部最大值(LOMO)特征、WHOS特征、ELF特征等。这些特征配合不同的度量学习方法,取得了很好的效果。然而,上述特征的局限性在于仅仅对单张图像进行描述,而没有对监控视频的帧间信息进行利用。
技术实现思路
本专利技术的目地在于克服现有技术的不足,提出一种设计合理、匹配效率高且性能稳定的针对视频数据行人再识别的LOMO3D特征提取方法。本专利技术解决其技术问题是采取以下技术方案实现的:一种针对视频数据行人再识别的LOMO3D特征提取方法,包括以下步骤:步骤1、将视频数据中的各帧分离出来,组织成图像序列的形式,并分割为一定长度的等长序列;步骤2、将每个序列水平分割为若干扁平区域,并在这些区域中进一步划分子块,作为直方图统计的最小单位;步骤3、对于每个子块,根据其中包含的像素点计算SILTP3D特征,统计形成纹理直方图特征;步骤4、对于每个子块,根据其中包含的像素点计算HSV色域下的颜色直方图特征;步骤5、将每个水平区域中的纹理和颜色直方图特征根据最大化原则进行整合;步骤6、将整合后的各水平区域的特征进行拼合,得到最终的LOMO3D特征描述子。所述等长序列的长度为20。所述步骤1的具体实现方法为:针对长度不一致的视频数据,将视频各帧视为连续图像序列,并以20帧为长度划分为子序列,将该序列视为高度、宽度、长度分别为图像高度、图像宽度、帧数的立方体,以此作为LOMO3D特征描述子的提取对象。所述步骤2的具体实现方法为:将每个划分好的视频序列组成的场方体,进一步分割为水平的扁形区域,并进一步将这些区域划分为小的子块,所述子块在高度、宽度、时间长度上的尺寸分别为10像素、10像素、8帧,且这些子块相互重叠,重叠率为0.5。所述步骤3的具体实现方法包括以下步骤:⑴给定像素位置(xc,yc),原始SILTP的编码规则如下:其中,Ic表示中心像素的灰度值,Ik是在当前帧围绕它的半径为R的圆上的N个相邻点,τ是一个尺度参数,sτ定义如下:⑵在R=1的情况下,将SILTP3D特征所覆盖的像素点数从8个增加至26个;⑶我们取了36个直方,对步骤2中所述的每个子块中所包含的像素点进行统计,形成纹理直方图特征。所述步骤4的具体实现方法为:首先将每帧图像由RGB颜色空间转换为HSV颜色空间,然后对步骤2中所述的每个子块中所包含的像素点统计直方图特征,HSV颜色特征的直方数为83个。所述步骤5的具体实现方法为:设图像序列的高度为128像素,宽度为64像素,长度为20帧,所取最小子块的高度为10像素,宽度为10像素,长度为8帧,且在水平方向和时间方向的重叠率均为0.5,则每个扁形区域共有11*4=44个子块,每个子块所提取的特征为83+36=1241个直方,对所有子块相同位置上的直方取最大值,得到每个扁形区域的特征。所述步骤6的具体实现方法为:将每个原始图像序列分为由上到下的24个不重叠的扁形区域,对原始图像进行了两次2*2的池化处理,从而除原始的128*64*20的序列外,还对64*32*20、32*16*20的序列进行了特征提取操作,将共有24+11+5个扁形区域的特征最终拼合起来,构成最后的LOMO3D特征。本专利技术的优点和积极效果是:本专利技术设计合理,其从图像序列中提取的时-空特征,并在这一过程中加入了时间信息,充分利用了图像序列中相比于单张图像更为丰富的信息,对这两种特征进行综合利用,使得特征的描述能力性能远远高于单纯的空间域特征,试验表明本专利技术能够使得系统整体匹配率大大提升,优于目前其他的行人再识别算法。附图说明图1是SILTP3D特征提取的原理图;图2是LOMO3D特征提取的原理图;图3a至图3f是本专利技术试验结果给出的不同参数及不同特征的性能对比分析图。具体实施方式以下结合附图对本专利技术实施例做进一步详述。一种针对视频数据行人再识别的LOMO3D特征提取方法,包括以下步骤:步骤1、将视频数据中的各帧分离出来,组织成图像序列的形式,并分割为长度为20的等长序列。本步骤的具体处理方法为:针对长度不一致的视频数据,首先将视频各帧视为连续图像序列,并以20帧为长度划分为子序列,将该序列视为高度、宽度、长度分别为图像高度、图像宽度、帧数的立方体,以此作为LOMO3D特征描述子的提取对象。步骤2、将每个序列水平分割为若干扁平区域,并在这些区域中进一步划分子块,作为直方图统计的最小单位。本步骤的具体处理方法为:将每个划分好的视频序列组成的长方体,进一步分割为水平的扁形区域,并进一步将这些区域划分为小的子块。子块在高度、宽度、时间长度上的尺寸分别为10像素、10像素、8帧,且这些子块相互重叠,重叠率为0.5。步骤3、对于每个子块,根据其中包含的像素点计算SILTP3D特征,统计形成纹理直方图特征。本步骤的具体处理方法如下:给定像素位置(xc,yc),原始SILTP的编码规则如下式:其中,Ic表示中心像素的灰度值,Ik是在当前帧围绕它的半径为R的圆上的N个相邻点,τ是一个尺度参数,sτ定义如下:如图1所示(左侧为原始SILTP特征,右侧为改进后的SILTP3D特征),考虑到前后帧相对于当前帧的临近像素,在R=1的情况下,SILTP3D特征所覆盖的像素点数从8个增加至26个。计算SILTP3D特征的直方图时,我们取了36个直方,对步骤2中所述的每个子块中所包含的像素点进行统计。步骤4、对于每个子块,根据其中包含的像素点计算HSV色域下的颜色直方图特征。本步骤的具体处理方法为:首先将每帧图像由RGB颜色空间转换为HSV颜色空间,然后对步骤2中所述的每个子块中所包含的像素点统计直方图特征。在这里,HSV颜色特征的直方数为83个。步骤5、将每个水平区域中的纹理和颜色直方图特征根据最大化原则进行整合。本步骤的具体处理方法为:图像序列的高度为128像素,宽度为64像素,长度为20帧。所取最小子块的高度为10像素,宽度为10像素,长度为8帧,且在水平方向和时间方向的重叠率均为0.5,即每个扁形区域共有11*4=44个子块,每个子块所提取的特征为83+36=1241个直方,对所有子块相同位置上的直方取最大值,得到每个扁形区域的特征。步骤6、将整合后的各水平区域的特征进行拼合,得到最终的特征描述子。本步骤的具体处理方法为:每个原始图像序列被由上到下分为24个不重叠的扁形区域。为了增强特征在不同尺度下的描述能力,对原始图像进行了两次2*2的池化处理,即除原始的128*64*20的序列外,还对64*32*20、32*16*20的序列进行了特征提取操作,即本文档来自技高网...
针对视频数据行人再识别的LOMO3D特征提取方法

【技术保护点】
一种针对视频数据行人再识别的LOMO3D特征提取方法,其特征在于包括以下步骤:步骤1、将视频数据中的各帧分离出来,组织成图像序列的形式,并分割为一定长度的等长序列;步骤2、将每个序列水平分割为若干扁平区域,并在这些区域中进一步划分子块,作为直方图统计的最小单位;步骤3、对于每个子块,根据其中包含的像素点计算SILTP3D特征,统计形成纹理直方图特征;步骤4、对于每个子块,根据其中包含的像素点计算HSV色域下的颜色直方图特征;步骤5、将每个水平区域中的纹理和颜色直方图特征根据最大化原则进行整合;步骤6、将整合后的各水平区域的特征进行拼合,得到最终的LOMO3D特征描述子。

【技术特征摘要】
1.一种针对视频数据行人再识别的LOMO3D特征提取方法,其特征在于包括以下步骤:步骤1、将视频数据中的各帧分离出来,组织成图像序列的形式,并分割为一定长度的等长序列;步骤2、将每个序列水平分割为若干扁平区域,并在这些区域中进一步划分子块,作为直方图统计的最小单位;步骤3、对于每个子块,根据其中包含的像素点计算SILTP3D特征,统计形成纹理直方图特征;步骤4、对于每个子块,根据其中包含的像素点计算HSV色域下的颜色直方图特征;步骤5、将每个水平区域中的纹理和颜色直方图特征根据最大化原则进行整合;步骤6、将整合后的各水平区域的特征进行拼合,得到最终的LOMO3D特征描述子。2.根据权利要求1所述的针对视频数据行人再识别的LOMO3D特征提取方法,其特征在于:所述等长序列的长度为20。3.根据权利要求1或2所述的针对视频数据行人再识别的LOMO3D特征提取方法,其特征在于:所述步骤1的具体实现方法为:针对长度不一致的视频数据,将视频各帧视为连续图像序列,并以20帧为长度划分为子序列,将该序列视为高度、宽度、长度分别为图像高度、图像宽度、帧数的立方体,以此作为LOMO3D特征描述子的提取对象。4.根据权利要求1或2所述的针对视频数据行人再识别的LOMO3D特征提取方法,其特征在于:所述步骤2的具体实现方法为:将每个划分好的视频序列组成的场方体,进一步分割为水平的扁形区域,并进一步将这些区域划分为小的子块,所述子块在高度、宽度、时间长度上的尺寸分别为10像素、10像素、8帧,且这些子块相互重叠,重叠率为0.5。5.根据权利要求1或2所述的针对视频数据行人再识别的LOMO3D特征提取方法,其特征在于:所述步骤3的具体实现方法包括以下步骤:⑴给定像素位置(xc,yc),原始SILTP的编码规则如下:

【专利技术属性】
技术研发人员:郑苏桐周芸王强付光涛郭晓强姜竹青门爱东
申请(专利权)人:国家新闻出版广电总局广播科学研究院北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1