基于对偶综合‑解析字典学习的行人再识别方法技术

技术编号:17249243 阅读:21 留言:0更新日期:2018-02-11 07:36
本发明专利技术设计了一种基于对偶综合‑解析字典学习的行人再识别方法,其主要技术特点是:从行人再识别数据中提取行人图像特征;采用局部Fisher判决分析方法将不同摄像机视角下的行人图像特征投影到公共特征空间;运用对偶综合‑解析字典学习算法,在公共特征空间中学习对偶综合字典和对偶解析字典;建立行人匹配模型,并利用改进余弦公式进行行人距离计算。本发明专利技术设计合理,其通过在原始对偶综合字典学习中引入对偶解析字典,解析字典拥有判决能力,提高了综合字典的数据表示能力,使得字典能够更有效的表示数据的本征结构,获得了有效的再识别性能。

【技术实现步骤摘要】
基于对偶综合-解析字典学习的行人再识别方法
本专利技术属于视觉识别
,尤其是一种基于对偶综合-解析字典学习的行人再识别方法。
技术介绍
随着安全监控摄像头的不断增多以及视频采集技术和大规模数据存储的快速发展,使得人工识别监控画面面临着大量的困难和挑战,从而令计算机视觉中的行人再识别技术得到了广泛的关注。行人再识别技术其目的是在非重叠区域的多个摄像头中,识别同一个人。由于摄像头采集的视频内容的丰富和多样化,因此存在许多挑战,例如强烈的光照变化、物体遮挡、亮度变化以及低像素画面,这些挑战使得现有的行人再识别技术所能达到的识别准确率较低。针对上述挑战,现有的识别方法主要分为两类:一是鲁棒特征提取方法;二是距离度量方法。然而,摄像头的多变条件变化约束了这两种方法的数据表示能力。近年来,字典学习展现了强大的数据表示能力,并在计算机视觉中得到了广泛的应用。其中对偶字典学习方法在行人再识别这种交叉视角问题中取得一定的效果,然而,传统的对偶字典学习方法属于对偶综合字典学习方法,所学得的字典不仅要有数据表示能力,还要有判决能力。这种方法降低了字典学习本身的表示能力,使得字典很难挖掘数据的固有结构。因此,如何提高综合字典的数据表示能力成为了一个关键研究问题。
技术实现思路
本专利技术的目地在于克服现有技术的不足,提出一种设计合理、能够提高综合字典的数据表示能力的基于对偶综合-解析字典学习的行人再识别方法。本专利技术解决其技术问题是采取以下技术方案实现的:一种基于对偶综合-解析字典学习的行人再识别方法,包括以下步骤:步骤1、从行人再识别数据中提取行人图像特征;步骤2、采用局部Fisher判决分析方法将不同摄像机视角下的行人图像特征投影到公共特征空间;步骤3、运用对偶综合-解析字典学习算法,在公共特征空间中学习对偶综合字典和对偶解析字典;步骤4、建立行人匹配模型,并利用改进余弦公式进行行人距离计算。所述步骤1提取的行人图像特征为LOMO特征,具体提取方法为:首先,将图像按垂直方向分为水平的条状区域,将每个条状区域分成各个小块;然后,对该条状区域的每个小块进行直方图特征提取,对每个直方取最大值,得到该条状区域的直方图特征;最后,将图像的所有水平区域的直方图特征进行串联,得到该图像的LOMO特征。所述直方图特征包括HSV颜色域的直方图以及SILTP纹理特征直方图。所述步骤2的实现方法为:给定训练数据集,使用局部Fisher判决分析学习转换矩阵T,并将原始特征向量通过T转换进入公共特征空间。所述步骤3的具体实现方法包括以下步骤:步骤3.1、建立如下对偶综合-解析字典学习模型:其中,||·||F为矩阵的F-范数,d为字典原子,XA和XB为相机A和相机B的行人图像训练数据,PA和PB是具有判决能力的对偶解析字典,DA和DB为具有数据表示能力对偶综合字典;PA和DA形成一个对偶综合-解析字典对,通过联合学习PA和DA,得到编码系数矩阵ZA=PAXA,并且运用综合字典DA重构训练数据XA≈DAZA;步骤3.2、建立如下总体目标函数:其中,λ1和λ2为正则化参数,一旦和被得到,对偶综合-解析字典学习能够被更新,从而解析编码系数并重构行人图像;步骤3.3、对总体目标函数进行优化更新:引入附加变量ZA和ZB,采用变更迭代优化更新所有变量,对于变量PA,PB,WA,WB,ZA,ZB,所求得的为封闭解,对于DA和DB,采用ADMM算法实现。所述步骤4的具体实现方法包括以下步骤:步骤4.1、根据综合字典DA和DB,给定备选集和查询集,备选集第j个图像为pA,j,查询集第k个图像为pB,k,采用如下方法计算行人特征的编码表示系数:其中,αA,j和αB,k分别为来自摄像头A与摄像头B的行人特征编码表示系数,μ为正则化系数。步骤4.2、采用下述改进余弦公式计算行人间距,并进行排列,实现行人再识别功能:其中,ε为较小的正数,防止分母出现零的情况。本专利技术的优点和积极效果是:本专利技术设计合理,其通过在原始对偶综合字典学习中引入对偶解析字典,解析字典拥有判决能力,提高了综合字典的数据表示能力,使得字典能够更有效的表示数据的本征结构,获得了有效的再识别性能。本方法在公开的数据库上进行了测试,实验表明提出的方法优于目前其他的行人再识别算法。附图说明图1是本专利技术的处理流程图;图2a是采用不同算法在图像序列数据集VIPeR上的CMC曲线图;图2b是采用不同算法在图像序列数据集CUHK01上的CMC曲线图。具体实施方式以下结合附图对本专利技术实例做进一步详述。一种基于对偶综合-解析字典学习的行人再识别方法,如图1所示,包括以下步骤:步骤1、从行人再识别数据中提取行人图像特征,运用的特征提取方法为LOMO特征。在本步骤中,分别提取不同视角下的行人图像的LOMO特征。在提取LOMO特征时,首先,将图像按垂直方向分为水平的条状区域,将每个条状区域分成各个小块,然后对每个小块进行直方图特征提取(取得单个条状区域的所有直方图),其中包括HSV颜色域的直方图以及SILTP纹理特征直方图。然后,对每个直方取最大值,得到该区域的直方特征。最后将图像的所有水平区域按前面所述方法得到的直方图特征进行串联,则得到该图像的LOMO特征。LOMO特征描述了水平方向上的局部最大可能代表该区域的特征,对视角变化等问题有很强的鲁棒性。由于LOMO特征所得到的串联特征数据有上万维,因此采用了PCA对所有训练图像特征进行数据降维。步骤2、采用局部Fisher判决分析方法将不同摄像机视角下的行人图像特征投影到公共特征空间。局部Fisher判决分析不仅能最小化类内离散度,最大化类间离散度,同时还能保持数据之间的局部几何结构。因此给定训练数据集,使用局部Fisher判决分析学习转换矩阵T,并将原始特征向量通过T转换进入公共特征空间。步骤3、运用对偶综合-解析字典学习算法,在公共特征空间中学习对偶综合字典和对偶解析字典。步骤3.1:建立对偶综合-解析字典学习模型,该模型的总体框架如下:其中,||·||F为矩阵的F-范数,d为字典原子,XA和XB为相机A和相机B的行人图像训练数据,PA和PB是对偶解析字典,具有判决能力;DA和DB对偶综合字典,具有数据表示能力。PA和DA形成了一个对偶综合-解析字典对,通过联合学习PA和DA,得到编码系数矩阵ZA=PAXA,同时可以运用综合字典DA重构训练数据XA≈DAZA。相机B的处理过程与A相同。框架的最后一项是联系函数,该函数具有判决能力,能够更好的描述交叉视角数据的固有结构。步骤3.2:设定对偶字典学习的假设条件为:存在隐藏的对偶特征空间使得相同目标的编码系数严格相等,该假设条件太绝对,而不同原始空间中的目标数据拥有各种结构,很难达到严格相等的目的,因此,本专利技术松弛该假设,利用一对解析字典学习这个隐藏对偶特征空间。即本专利技术引入一个映射转换WA和WB,并考虑下面最小化问题其中MA和MB为投影到对偶特征空间后的数据,保证上述公式最小化,即表示相同的人在对偶特征空间中的距离更近。为了避免平凡解,使得表述更精确,本专利技术推导如下过程:对于相同的人m,因此,可以得到最后的总体目标函数为:其中,λ1和λ2为正则化参数,一旦和被得到,对偶综合-解析字典学习能够被更新,从而解析编码系数并重构行人图本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201710816499.html" title="基于对偶综合‑解析字典学习的行人再识别方法原文来自X技术">基于对偶综合‑解析字典学习的行人再识别方法</a>

【技术保护点】
一种基于对偶综合‑解析字典学习的行人再识别方法,其特征在于包括以下步骤:步骤1、从行人再识别数据中提取行人图像特征;步骤2、采用局部Fisher判决分析方法将不同摄像机视角下的行人图像特征投影到公共特征空间;步骤3、运用对偶综合‑解析字典学习算法,在公共特征空间中学习对偶综合字典和对偶解析字典;步骤4、建立行人匹配模型,并利用改进余弦公式进行行人距离计算。

【技术特征摘要】
1.一种基于对偶综合-解析字典学习的行人再识别方法,其特征在于包括以下步骤:步骤1、从行人再识别数据中提取行人图像特征;步骤2、采用局部Fisher判决分析方法将不同摄像机视角下的行人图像特征投影到公共特征空间;步骤3、运用对偶综合-解析字典学习算法,在公共特征空间中学习对偶综合字典和对偶解析字典;步骤4、建立行人匹配模型,并利用改进余弦公式进行行人距离计算。2.根据权利要求1所述的基于对偶综合-解析字典学习的行人再识别方法,其特征在于:所述步骤1提取的行人图像特征为LOMO特征,具体提取方法为:首先,将图像按垂直方向分为水平的条状区域,将每个条状区域分成各个小块;然后,对该条状区域的每个小块进行直方图特征提取,对每个直方取最大值,得到该条状区域的直方图特征;最后,将图像的所有水平区域的直方图特征进行串联,得到该图像的LOMO特征。3.根据权利要求2所述的基于对偶综合-解析字典学习的行人再识别方法,其特征在于:所述直方图特征包括HSV颜色域的直方图以及SILTP纹理特征直方图。4.根据权利要求1所述的基于对偶综合-解析字典学习的行人再识别方法,其特征在于:所述步骤2的实现方法为:给定训练数据集,使用局部Fisher判决分析学习转换矩阵T,并将原始特征向量通过T转换进入公共特征空间。5.根据权利要求1所述的基于对偶综合-解析字典学习的行人再识别方法,其特征在于:所述步骤3的具体实现方法包括以下步骤:步骤3.1、建立如下对偶综合-解析字典学习模型:其中,||·||F为矩阵的F-范数,d为字典原子,XA和XB为相机A和相机B的行人图像训练数据,PA和PB是具有判决能力的对偶解析字典,DA和DB为具有数据表示能力对偶综合字典;PA和DA形成一个对偶综合-解析字典对,通过联合学习PA和DA,得到编码系数矩阵ZA=PAXA,并且运用综合字典DA重构训练数据XA≈DAZA;步骤3.2、建立如下总体目标函数:

【专利技术属性】
技术研发人员:孙灵川周芸姜竹青李小雨门爱东饶丰
申请(专利权)人:国家新闻出版广电总局广播科学研究院北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1