一种融合HOG-LBP和KCF的行人跟踪方法技术

技术编号:26421420 阅读:75 留言:0更新日期:2020-11-20 14:17
本发明专利技术公开了一种融合HOG‑LBP和KCF的行人跟踪方法,获取行人视频,设定跟踪目标,确定候选区域,提取候选区域图像的HOG‑LBP特征,根据提取的图像的HOG‑LBP特征计算核相关滤波器,通过得到的核相关检测更新行人位置,更新滤波器,输出跟踪结果;本发明专利技术方法可以解决KCF行人跟踪算法中,当背景覆盖着凌乱的噪声边缘时,HOG特征无法处理,导致跟踪漂移和失败,算法鲁棒性降低的问题。

【技术实现步骤摘要】
一种融合HOG-LBP和KCF的行人跟踪方法
本专利技术属于机器视觉
,涉及一种融合HOG-LBP和KCF的行人跟踪方法。
技术介绍
随着国家提出“智慧城市”理念,人工智能技术的研究和发展备受关注。行人跟踪作为人工智能的计算机视觉领域最主要研究任务之一,在自动驾驶、智能安防以及智能机器人等方面具有广阔的应用价值,已经吸引了广大学者的关注与研究,并涌现出许多相关行人跟踪算法,KCF(KernelCorrelationFilter)核相关滤波算法则是代表之一。然而,传统的KCF跟踪算法采用HOG特征(HistogramofOrientedGradient,方向梯度直方图)来表征行人,HOG在描述图像边缘信息或者局部形状信息时效果良好,当背景覆盖着凌乱的噪声边缘时,HOG则无法处理。这就导致跟踪漂移和失败,算法鲁棒性降低。针对这一问题,本文结合了HOG特征和LBP特征(LocalBinaryPattern,局部二值模式)即HOG-LBP特征。LBP特征具有灰度不变性和旋转不变性等,可以处理背景覆盖着凌乱的噪声边缘。结合两者能够更好地表征行人,提高跟踪的准确性。
技术实现思路
本专利技术的目的是提供一种融合HOG-LBP和KCF的行人跟踪方法,解决了KCF算法中的漂移问题,在保证算法速度的前提下,提高了跟踪算法的鲁棒性。本专利技术所采用的技术方案是,一种融合HOG-LBP和KCF的行人跟踪方法,具体按以下步骤实施:步骤1,获取行人视频,设定跟踪目标,确定候选区域;步骤2,提取候选区域图像的HOG-LBP特征;步骤3,根据经步骤2提取的图像的HOG-LBP特征计算核相关滤波器;步骤4,通过步骤3计算得到的核相关检测更新行人位置;步骤5,更新滤波器;步骤6,输出跟踪结果。本专利技术的特点还在于:其中步骤1具体内容为:获取行人视频,读入第t帧图像Image1,设定跟踪目标,并将跟目标所在区域作为第一帧的候选区域;其中步骤2中HOG-LBP特征提取过程分为三步:HOG特征提取、LBP特征提取和HOG-LBP特征融合;其中HOG特征提取步骤主要包括图像归一化、计算梯度、基于梯度幅度的方向权重投影、特征向量归一化几个部分,具体计算过程如下:设定候选区域的大小为80×64,设置block块的大小8×8,则候选区域共包含80个不重叠的block;在每个block上计算其梯度方向和幅值,采用简单的中心对称算子[-1,0,1]计算梯度,如下式所示:式中,I(x,y)是图像在点(x,y)的像素值,θ(x,y)为该点的梯度方向,m(x,y)对应为该点的幅度值;设置cell大小为4×4,在每个block内按cell大小统计梯度直方图,应用梯度的幅值进行规定权重投影;对于每个重叠block内的cell进行对比度归一化;将所有block内的直方图向量组合得到最终的HOG特征向量;其中LBP特征提取的具体内容为:LBP算子由(P,R)来表示,其中,P表示领域内包含的像素个数;R表示领域半径,基本的LBP算子是(8,1)领域:首先将3×3领域像素值pi(i=1,2,…,8)与中心像素值p0进行比较,进行阈值化处理,其计算公式为:将bi(i=1,2,…,8)按顺时针方向排列得到一个8位的二进制编码,再转换为十进制数,则得到LBP算子对中心像素计算得到后的结果;然后行人图像经过LBP算子运算后,对其做直方图统计,得到直方图特征向量,具体可以定义为:式中,n为LBP算子产生不同标记的数据,采用3×3领域的一致模式算子,即n=256;当x为真时,I(x)=1;当x为假时,I(x)=0;再将图像分为区域R0,R1,…,Rm-1,各个区域的直方图可定义为:最后将这些子区域直方图连接起来构成最终的行人特征向量,采用χ2统计来度量LBP特征之间的距离;其中HOG-LBP特征融合的具体内容为:采用加权的方式进行特征融合,融合公式如下:式中,m表示分类器的数目,wi和ci分别表示第i个分类器的权重和输出分数,f(C)为特征融合后输出的分数;权重计算公式如下:式中,Ei为第i个分类器的等错误率;设定有m个不同的分类器,其行人图像特征为x,在对真实分类判别函数进行估计时,有m个不同的判别函数:gi(x)=h(x)+εi(x),i=1,2,…,m(8)式中,h(x)表示真实的分类判别函数,gi(x)表示第i个分类器的判别函数,而εi(x)则表示为gi(x)与真实函数之间的误差函数;在进行特征融合之后,整个特征融合系统的均方差可以表示为:式中,加权系数满足αi>0和其中步骤3中计算核相关滤波器的具体内容为:设x表示输入图像提取出的HOG-LBP特征,h表示相关滤波器,设x^表示x的傅里叶变换,根据卷积定理,空域中的卷积等价于频域中元素间的乘法运算,可得:式中,表示卷积,F-1表示傅里叶逆变换,·表示元素间的乘法运算,*表示复共轭;为了训练滤波器,定义期望的相关输出y,对于目标的新样本x',相关滤波器h满足条件因此得到:其中步骤4中检测更新行人位置的具体内容为:经步骤3得到核相关滤波h后,对于第t+1帧,在以上一帧目标位置为中心、大小为M×N的图像块z上进行检测,相关响应图为因此,新的目标位置通过f(z)最大值对应位置找到;其中步骤5中滤波器的更新具体内容为:采用线性插值的方式对滤波器系数α和目标外观模型x进行更新,即:式中,γ表示学习率,t表示帧数。本专利技术的有益效果是:本专利技术的一种融合HOG-LBP和KCF的行人跟踪方法可以解决KCF行人跟踪算法中,当背景覆盖着凌乱的噪声边缘时,HOG特征无法处理,导致跟踪漂移和失败,算法鲁棒性降低的问题,针对这一问题,本文结合了HOG特征和LBP特征即HOG-LBP特征,LBP特征具有灰度不变性和旋转不变性等,可以处理背景覆盖着凌乱的噪声边缘,结合两者能够更好地表征行人,提高行人跟踪的准确性。附图说明图1为本专利技术的一种融合HOG-LBP和KCF的行人跟踪方法中HOG-LBP融合框架图。具体实施方式下面结合附图和具体实施方式对本专利技术进行详细说明。本专利技术提供了一种融合HOG-LBP和KCF的行人跟踪方法,具体按以下步骤实施:步骤1,获取行人视频,读入第t帧图像Image1,设定跟踪目标,并将跟目标所在区域作为第一帧的候选区域;步骤2,HOG-LBP特征提取过程分为三步:HOG特征提取、LBP特征提取和HOG-LBP特征融合;具体实施步骤可分为以下几步,融合框架如图1所示:首先获取图像HOG特征提取,步骤主要包括图像归一化、计算梯度、基于梯度幅度本文档来自技高网...

【技术保护点】
1.一种融合HOG-LBP和KCF的行人跟踪方法,其特征在于,具体按以下步骤实施:/n步骤1,获取行人视频,设定跟踪目标,确定候选区域;/n步骤2,提取候选区域图像的HOG-LBP特征;/n步骤3,根据经步骤2提取的图像的HOG-LBP特征计算核相关滤波器;/n步骤4,通过步骤3计算得到的核相关检测更新行人位置;/n步骤5,更新滤波器;/n步骤6,输出跟踪结果。/n

【技术特征摘要】
1.一种融合HOG-LBP和KCF的行人跟踪方法,其特征在于,具体按以下步骤实施:
步骤1,获取行人视频,设定跟踪目标,确定候选区域;
步骤2,提取候选区域图像的HOG-LBP特征;
步骤3,根据经步骤2提取的图像的HOG-LBP特征计算核相关滤波器;
步骤4,通过步骤3计算得到的核相关检测更新行人位置;
步骤5,更新滤波器;
步骤6,输出跟踪结果。


2.根据权利要求1所述的一种融合HOG-LBP和KCF的行人跟踪方法,其特征在于,所述步骤1具体内容为:
获取行人视频,读入第t帧图像Image1,设定跟踪目标,并将跟目标所在区域作为第一帧的候选区域。


3.根据权利要求1所述的一种融合HOG-LBP和KCF的行人跟踪方法,其特征在于,所述步骤2中HOG-LBP特征提取过程分为三步:HOG特征提取、LBP特征提取和HOG-LBP特征融合。


4.根据权利要求3所述的一种融合HOG-LBP和KCF的行人跟踪方法,其特征在于,所述HOG特征提取步骤主要包括图像归一化、计算梯度、基于梯度幅度的方向权重投影、特征向量归一化几个部分,具体计算过程如下:
设定候选区域的大小为80×64,设置block块的大小8×8,则候选区域共包含80个不重叠的block;
在每个block上计算其梯度方向和幅值,采用简单的中心对称算子[-1,0,1]计算梯度,如下式所示:






式中,I(x,y)是图像点(x,y)的像素值,θ(x,y)为该点的梯度方向,m(x,y)对应为该点的幅度值;
设置cell大小为4×4,在每个block内按cell大小统计梯度直方图,应用梯度的幅值进行规定权重投影;
对于每个重叠block内的cell进行对比度归一化;
将所有block内的直方图向量组合得到最终的HOG特征向量。


5.根据权利要求3所述的一种融合HOG-LBP和KCF的行人跟踪方法,其特征在于,所述LBP特征提取的具体内容为:
LBP算子由(P,R)来表示,其中,P表示领域内包含的像素个数;R表示领域半径,基本的LBP算子是(8,1)领域:
首先将3×3领域像素值pi(i=1,2,…,8)与中心像素值p0进行比较,进行阈值化处理,其计算公式为:



将bi(i=1,2,…,8)按顺时针方向排列得到一个8位的二进制编码,再转换为十进制数,则得到LBP算子对中心像素计算得到后的结果;
然后行人图像经过LBP算子运算后,对其做直方图统计,得到直方图特征向量,具体可以定义为:

【专利技术属性】
技术研发人员:陈宁李梦璐刘志坚杨迪
申请(专利权)人:西安工程大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1