一种基于分层核稀疏表示的行人检测方法技术

技术编号:11529355 阅读:161 留言:0更新日期:2015-05-31 18:05
本发明专利技术公开了一种基于分层核稀疏表示的行人检测方法,其特征是按如下步骤进行:对采集的交通视频进行预处理,获得需要的正负样本,通过分层的子块划分,获得多尺度的特征向量,并构建两类字典矩阵;对待测的行人图像进行预处理,得到测试样本,用字典构建过程相同的方式进行行人特征提取,形成测试样本的特征向量;采用直方图交叉核函数,对测试样本的特征向量进行核稀疏分解,并在迭代解决过程中采用高斯函数加权,再通过重建误差实现行人检测。本发明专利技术可以获得较好的检测性能,有效提高了行人检测在部分遮挡情况下的准确性,增强了行人检测系统对于外观变化的鲁棒性。

【技术实现步骤摘要】
一种基于分层核稀疏表示的行人检测方法
本专利技术属于智能交通领域,具体涉及一种基于分层核稀疏表示的行人检测方法。
技术介绍
行人检测就是要把视频或者图像中出现的行人从背景中分割出来并精确定位,它在视频监控、智能驾驶等领域有着广泛的应用前景。但由于行人目标无论是在身材、衣着、姿势,还是在视角、光照方面都有着较大的变化,加之复杂的背景场景以及摄像头自身的移动和晃动,同时行人检测要求很高的精度和实时性,使得行人检测成为智能交通领域的最困难的课题之一。目前行人检测系统一般分为外观特征提取和分类学习两部分,常用的外观特征如Harr小波,方向梯度直方图(HistogramsofOrientedGradient,HOG),基于Gabor滤波器皮层特征、流形特征、形状特征和颜色特征等。常用的分类学习方法有Adaboost集成学习、支持向量机(SupportVectorMachine,SVM),神经网络(NeuralNetwork,NN)。在驾驶辅助系统等应用中对行人检测的准确性有较高要求,但现有方法一般采用固定的算法流程提取目标的全局特征,如方向梯度直方图实现方法是先将图像分成小的方格单元连通区域;然后采集方格单元中各像素点的梯度方向或边缘方向直方图;最后把这些直方图组合起来就可以构成特征描述子,这种固有流程提取的全局特征不能够适应场景与行人外观的快速变换。同时由于街道附属物,车辆、树木等形成的部分遮挡,也使得通过分类器训练得到的分类模型难以准确的分辨行人,现有方法难以稳定的处理部分遮挡,视角变换等复杂情况。
技术实现思路
本专利技术为克服上述现有技术中存在的问题,提出一种基于分层核稀疏表示的行人检测方法,以期能有效地克服行人外观形变与部分遮挡的影响,增强行人检测对于外观变化的鲁棒性,从而实现行人的高效检测。本专利技术为解决技术问题采用如下技术方案:本专利技术一种基于分层核稀疏表示的行人检测方法的特点是按如下步骤进行:步骤1、字典构建:步骤1.1、从交通视频中获取N幅样本图像,从所述N幅样本图像中提取比例为x:y的行人区域和非行人区域;x表示所述行人区域或非行人区域的宽;y表示所述行人区域或非行人区域的高;且x≤y;将所述行人区域和非行人区域进行大小为a×b的归一化处理,分别获得行人正样本和非行人负样本;步骤1.2、分别从所述行人正样本和非行人负样本中选取n个行人正样本和n个行人负样本;并分别转换为n个行人正样本的灰度图和n个行人负样本的灰度图;对所述n个行人正样本的灰度图和n个行人负样本的灰度图分别进行梯度计算,获得n个行人正样本的梯度幅值和n个行人负样本的梯度幅值;由所述n个行人正样本的梯度幅值构成n个正样本的特征图;由n个行人负样本的梯度幅值构成n个负样本的特征图;步骤1.3、从所述n个正样本的特征图和n个负样本的特征图中选出第j个样本,1≤j≤2n;对所述第j个样本进行三层划分,第一层以p1×q1进行划分,第二层以p2×q2进行划分,第三层以p3×q3进行划分,从而获得p1×q1+p2×q2+p3×q3=M个子块,且p1×q1>p2×q2>p3×q3;步骤1.4、对所述第j个样本的第i个子块进行CENTRIST直方图描述子的提取,获得所述第j个样本的第i个子的m维局部特征向量从而获得所述第j个样本的M个m维局部特征向量1≤i≤M;将所述M个m维局部特征向量进行级联,获得第j个样本的特征向量xj;从而获得2n个样本的特征向量{x1,x2,…,xj,…,x2n};其中,特征向量{x1,x2,…,xn}为正样本的特征向量;特征向量{xn+1,xn+2,…,x2n}为负样本的特征向量;步骤1.5、对所述正样本的特征向量{x1,x2,…,xn}按列排序形成正样本字典X0;对所述负样本的特征向量{xn+1,xn+2,…,x2n}按列排序形成负样本字典X1;由所述正样本字典X0和负样本字典X1构成字典X;由所述n个正样本或n个负样本中所有第i个子块构成的子字典记为第i个子字典Xi;步骤2:行人检测:步骤2.1、假设测试图像为I,对所述测试图像I进行尺度为u倍到v倍之间的G次缩放处理,获得G幅不同尺度的待检测图像{S1,S2,…,Sg,…SG},Sg表示第g幅待检测图像;1≤g≤G;u≥1;0<v<1;步骤2.2、以a×b为检测窗对所述第g幅待检测图像Sg按照扫描步长为c的“Z”字型进行扫描获得若干个候选区域,记任意个候选区域为D;c∈[2,32];步骤2.3、对所述任意个候选区域D进行梯度计算,获得所述任意个候选区域D的梯度幅值;由所述任意个候选区域D的梯度幅值构成所述任意个候选区域D的特征图;对所述任意个候选区域D的特征图进行三层划分,从而获得所述任意个候选区域D的M个子块;对所述任意个候选区域D的每个子块进行CENTRIST直方图描述子的提取,从而获得M个m维局部特征向量{y1,y2,…,ys,…,yM};ys表示第s个子块所提取的m维局部特征向量;1≤s≤M;对所述M个m维局部特征向量{y1,y2,…,ys,…,yM}进行级联,获得所述任意个候选区域D的特征向量y;步骤2.4、对所述任意个候选区域D的第s个子块利用式(1)进行加权核稀疏表示αs:式(1)中,ωs表示第s个子块的加权系数,k(·,·)表示直方图交叉核函数;Xs表示第s个子字典;λ表示正则化因子;步骤2.5、利用式(2)计算第s个子块的重建误差es:步骤2.6、利用式(3)所示的高斯加权函数计算第s个子块的加权系数ωs:式(3)中,σ表示高斯加权函数的方差;步骤2.7、定义t为迭代次数,并初始化t=1;令第t次迭代下的第s个子块的加权系数利用式(4)所示的汇聚条件获得第t次迭代下的第s个子块的加权系数和第s个子块的重建误差式(4)中,τ为迭代终止参数;步骤2.8、利用所述第t次迭代下的所有子块的加权系数与重建误差的乘积和分别计算所述正样本字典X0的总重建误差和负样本字典X1的总重建误差;步骤2.9、判断所述正样本字典X0的总重建误差是否小于所述负样本字典X1的总重建误差;若小于,则所述任意个候选区域D为行人区域;否则,所述任意个候选区域D为非行人区域;从而获得检测结果区域;进而获得所述第g幅待检测图像Sg中所有候选区域的检测结果区域;步骤2.10、重复步骤2.2-步骤2.9,从而获得所述G幅不同尺度的待检测图像{S1,S2,…,Sg,…SG}的所有检测结果区域;步骤2.11、利用非极大抑制算法对所述所有检测结果区域中的重复的检测结果区域进行合并;从而输出行人区域。与已有技术相比,本专利技术有益效果体现在:1、本专利技术首先采用分层特征提取的方式,多尺度的提取图像的区分信息;然后选取典型的行人与非行人样本构成两类字典,不需要冗长的模型训练环节,提高了对不同场景的适应性;再次,采用加权核稀疏表示技术,充分利用嵌入在分层特征中的区分信息实现行人分类;最后,采用高斯模型有效测度行人的遮挡程度,自动降低遮挡对于检测性能的影响,从而解决了交通场景中外观形变与部分遮挡下的行人检测问题,提高行人检测的准确性,实现了行人的高效检测。2、本专利技术采用分层特征提取的方式,将待测区域由密到疏划分成多个子块,从整体和局部多尺度的提取局部特征向量,构成可区分性的特征描述子,提高对外观形变和部分遮挡本文档来自技高网...
一种基于分层核稀疏表示的行人检测方法

【技术保护点】
一种基于分层核稀疏表示的行人检测方法,其特征是按如下步骤进行:步骤1、字典构建:步骤1.1、从交通视频中获取N幅样本图像,从所述N幅样本图像中提取比例为x:y的行人区域和非行人区域;x表示所述行人区域或非行人区域的宽;y表示所述行人区域或非行人区域的高;且x≤y;将所述行人区域和非行人区域进行大小为a×b的归一化处理,分别获得行人正样本和非行人负样本;步骤1.2、分别从所述行人正样本和非行人负样本中选取n个行人正样本和n个行人负样本;并分别转换为n个行人正样本的灰度图和n个行人负样本的灰度图;对所述n个行人正样本的灰度图和n个行人负样本的灰度图分别进行梯度计算,获得n个行人正样本的梯度幅值和n个行人负样本的梯度幅值;由所述n个行人正样本的梯度幅值构成n个正样本的特征图;由n个行人负样本的梯度幅值构成n个负样本的特征图;步骤1.3、从所述n个正样本的特征图和n个负样本的特征图中选出第j个样本,1≤j≤2n;对所述第j个样本进行三层划分,第一层以p1×q1进行划分,第二层以p2×q2进行划分,第三层以p3×q3进行划分,从而获得p1×q1+p2×q2+p3×q3=M个子块,且p1×q1>p2×q2>p3×q3;步骤1.4、对所述第j个样本的第i个子块进行CENTRIST直方图描述子的提取,获得所述第j个样本的第i个子的m维局部特征向量从而获得所述第j个样本的M个m维局部特征向量1≤i≤M;将所述M个m维局部特征向量进行级联,获得第j个样本的特征向量xj;从而获得2n个样本的特征向量{x1,x2,…,xj,…,x2n};其中,特征向量{x1,x2,…,xn}为正样本的特征向量;特征向量{xn+1,xn+2,…,x2n}为负样本的特征向量;步骤1.5、对所述正样本的特征向量{x1,x2,…,xn}按列排序形成正样本字典X0;对所述负样本的特征向量{xn+1,xn+2,…,x2n}按列排序形成负样本字典X1;由所述正样本字典X0和负样本字典X1构成字典X;由所述n个正样本或n个负样本中所有第i个子块构成的子字典记为第i个子字典Xi;步骤2:行人检测:步骤2.1、假设测试图像为I,对所述测试图像I进行尺度为u倍到v倍之间的G次缩放处理,获得G幅不同尺度的待检测图像{S1,S2,…,Sg,…SG},Sg表示第g幅待检测图像;1≤g≤G;u≥1;0<v<1;步骤2.2、以a×b为检测窗对所述第g幅待检测图像Sg按照扫描步长为c的“Z”字型进行扫描获得若干个候选区域,记任意个候选区域为D;c∈[2,32];步骤2.3、对所述任意个候选区域D进行梯度计算,获得所述任意个候选区域D的梯度幅值;由所述任意个候选区域D的梯度幅值构成所述任意个候选区域D的特征图;对所述任意个候选区域D的特征图进行三层划分,从而获得所述任意个候选区域D的M个子块;对所述任意个候选区域D的每个子块进行CENTRIST直方图描述子的提取,从而获得M个m维局部特征向量{y1,y2,…,ys,…,yM};ys表示第s个子块所提取的m维局部特征向量;1≤s≤M;对所述M个m维局部特征向量{y1,y2,…,ys,…,yM}进行级联,获得所述任意个候选区域D的特征向量y;步骤2.4、对所述任意个候选区域D的第s个子块利用式(1)进行加权核稀疏表示αs:minαs{Σs=1Mωsk(ys,ys)+αsTΣs=1Mωsk(Xs,Xs)αs-2αsTΣs=1Mωsk(Xs,ys)+λ||αs||1}---(1)]]>式(1)中,ωs表示第s个子块的加权系数,k(·,·)表示直方图交叉核函数;Xs表示第s个子字典;λ表示正则化因子;步骤2.5、利用式(2)计算第s个子块的重建误差es:es=k(ys,ys)+αsTk(Xs,Xs)αs-2αsTk(Xs,ys)---(2)]]>步骤2.6、利用式(3)所示的高斯加权函数计算第s个子块的加权系数ωs:ωs=12πσ2exp(-es22σ2)---(3)]]>式(3)中,σ表示高斯加权函数的方差;步骤2.7、定义t为迭代次数,并初始化t=1;令第t次迭代下的第s个子块的加权系数利用式(4)所示的汇聚条件获得第t次迭代下的第s个子块的加权系数和第s个子块的重建误差Σs=1M(ωs(t)-ωs(t-1))2/Σs=1M(ωs(t-1))2<τ---(4)]]>式(4)中,τ为迭代终止参数;步骤2.8、利用所述第t次迭代下的所有子块的加权系数与重建误差的乘积和分...

【技术特征摘要】
1.一种基于分层核稀疏表示的行人检测方法,其特征是按如下步骤进行:步骤1、字典构建:步骤1.1、从交通视频中获取N幅样本图像,从所述N幅样本图像中提取比例为x:y的行人区域和非行人区域;x表示所述行人区域或非行人区域的宽;y表示所述行人区域或非行人区域的高;且x≤y;将所述行人区域和非行人区域进行大小为a×b的归一化处理,分别获得行人正样本和非行人负样本;步骤1.2、分别从所述行人正样本和非行人负样本中选取n个行人正样本和n个行人负样本;并分别转换为n个行人正样本的灰度图和n个行人负样本的灰度图;对所述n个行人正样本的灰度图和n个行人负样本的灰度图分别进行梯度计算,获得n个行人正样本的梯度幅值和n个行人负样本的梯度幅值;由所述n个行人正样本的梯度幅值构成n个正样本的特征图;由n个行人负样本的梯度幅值构成n个负样本的特征图;步骤1.3、从所述n个正样本的特征图和n个负样本的特征图中选出第j个样本,1≤j≤2n;对所述第j个样本进行三层划分,第一层以p1×q1进行划分,第二层以p2×q2进行划分,第三层以p3×q3进行划分,从而获得p1×q1+p2×q2+p3×q3=M个子块,且p1×q1>p2×q2>p3×q3;步骤1.4、对所述第j个样本的第i个子块进行CENTRIST直方图描述子的提取,获得所述第j个样本的第i个子块的m维局部特征向量从而获得所述第j个样本的M个m维局部特征向量1≤i≤M;将所述M个m维局部特征向量进行级联,获得第j个样本的特征向量xj;从而获得2n个样本的特征向量{x1,x2,…,xj,…,x2n};其中,特征向量{x1,x2,…,xn}为正样本的特征向量;特征向量{xn+1,xn+2,…,x2n}为负样本的特征向量;步骤1.5、对所述正样本的特征向量{x1,x2,…,xn}按列排序形成正样本字典X0;对所述负样本的特征向量{xn+1,xn+2,…,x2n}按列排序形成负样本字典X1;由所述正样本字典X0和负样本字典X1构成字典X;由所述n个正样本和n个负样本中所有第i个子块构成的子字典记为第i个子字典Xi′;步骤2:行人检测:步骤2.1、假设测试图像为I,对所述测试图像I进行尺度为u倍到v倍之间的G次缩放处理,获得G幅不同尺度的待检测图像{S1,S2,…,Sg,…SG},Sg表示第g幅待检测图像;1≤g≤G;u≥1;0<v<1;步骤2.2、以a×b为检测窗对所述第g幅待检测图像Sg按照扫描步长为c的“Z”字型进行扫描获得若干个候选区域,记任意个候选区域为D;c∈[2,32];步骤2.3、对所述任意个候选区域D进行梯度计算,获得所述任意个候选区域D的梯度幅值;由所述任意个候选区域D的梯度幅值构成所述任意个候选区域D的特征图;对所述任意个候选区域D的特征图进行三层划分,从而获得所述任意个候选区域D的M个子块;对所述任意个候选区域D的每个子块进行CENTRIST直方图描述子的提取,从而获得M个m维局部特征向量{y1,y2...

【专利技术属性】
技术研发人员:孙锐张旭东高隽张广海
申请(专利权)人:合肥工业大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1