一种行人识别及定位方法技术

技术编号:20843631 阅读:35 留言:0更新日期:2019-04-13 08:51
本发明专利技术公开了一种行人识别及定位方法,包括训练阶段和检测阶段,训练阶段具体包括以下步骤:制作正样本集和负样本集;提取样本的HOG特征向量;训练SVM分类器。检测阶段包括:输入待识别定位图像;检测个体对应图像的一个矩形区域;提取矩形区域的HOG特征向量;利用线性SVM分类器判定矩形窗口是否包含行人;当已经检测完图像中所有的矩形区域时,输出检测结果,否则继续检测图像。本发明专利技术基于HOG‑SVM行人识别框架及多峰分布估计算法MEDA识别,在获得更快的检测速度的同时获得更准确的检测结果。

【技术实现步骤摘要】
一种行人识别及定位方法
本专利技术涉及计算机视觉以及智能进化算法两个领域,特别涉及一种基于HOG-SVM行人识别框架及多峰分布估计算法MEDA的识别及定位行人方法。
技术介绍
行人识别是目前计算机视觉的一个十分重要也非常富有挑战性的一个问题。近十年来,凭借着在智能机器人、智能驾驶、智能监控系统等领域起到越来越重要的作用,越来越多的科研者投入到行人识别的研究工作中。总的来说,行人识别可以分成两个主要的研究方向。其一是提出新的行人特征描述符,行人特征描述符的作用是从图像中提取特征,将行人与其他物体区分开,目前流行的行人特征描述符有HaarWavelet、LearningShapelet、HistogramofOrientedGradient(HOG)、self-similarityoncolorchannels(CSS)等,其中,凭借着对光照变化及行人动作的细微改变的鲁棒性,HOG成为了目前最热门的行人特征描述符。其二是研究如何定位图像中的行人,即研究如何在一整幅图像找到其所有行人,目前最普遍使用的定位方法是利用滑动窗口去遍历整幅图像,输出所有包含行人的矩形区域。基于上述两个研究方向,研究人员已经提出了许多可行的方法。其中最常见、最基本的行人识别方法是由Dalal和Triggs于2005年提出的HOG-SVM算法,Dalal和Triggs将他们提出的HOG特征描述符与线性SVM分类器相结合构成HOG-SVM行人识别框架,并利用滑动窗口定位行人,此框架能够很好地完成行人识别这一任务。虽然HOG-SVM在行人识别问题上能够取得较好的效果,但是HOG-SVM在检测率及检测速度上仍具有非常大的改善空间。为了提高HOG-SVM的检测效率,研究人员已经为此进行了大量的工作。其中,Watanabe等人利用co-HOG,即“梯度对”,代替HOG去描述行人的特征。此外,Walk等人提出一种新的特征描述符——区域颜色的自相似性,作为HOG的补充特征。以上工作都能很好地提高经典HOG-SVM算法的精度,但是随之也降低了算法的检测速度。为了提高HOG-SVM的检测速度,Zhu等人提出利用积分直方图来快速计算行人的HOG特征,并且在Adaboost的基础上构建级联的分类器,Zhu等人的研究能很好地加速传统HOG-SVM的检测过程,但其训练时间也大大增加。为在不影响训练速度的前提下提高算法的检测速度,一部分研究人员将目光转移到元启发式算法上。研究发现,传统HOG-SVM框架的很大一部分检测时间被花费在遍历整幅图像以定位图像中所有行人这一过程上,而此过程实质上可看作为一个搜索问题。针对检测过程中的搜索问题,最初An等人将其转换成一个三维搜索问题,并提出利用高斯粒子群优化算法(GaussianParticleSwarmOptimization,GPSO)去优化求解此问题(下文统称为HOG-SVM-GPSO),An等人提出的算法显著地加快了经典HOG-SVM算法的检测速度,但与此同时,检测精确度也随之降低。为进一步提高元启发式算法结合HOG-SVM框架的效率,Chen等人提出利用差分算法(DifferentialEvolution,DE)去优化HOG-SVM存在的搜索问题(下文统称为HOG-SVM-DE),其算法不仅能够显著提高检测速度,同时也很好地保证了HOG-SVM的检测精度。以上的研究工作表明将HOG-SVM结合元启发式算法能够显著缩短行人识别的时间。但上述研究存在一个明显缺陷,即其算法一次只能识别图像里面的单个行人,这也意味着他们的算法不适用于同时识别多个行人的场景。为了解决这个问题,Lin等人提出将HOG-SVM结合一种多峰优化算法NSDE同时识别图像中的多个行人(下文统称为HOG-SVM-GPSO)。Lin提出的算法的确能够同时定位多个行人且能显著地缩短检测的时间,但与此同时,其算法的识别率较大幅度地下降。
技术实现思路
本专利技术的主要目的在于克服现有技术的缺点与不足,提供一种行人识别及定位方法,此方法可得到更高的检测率及更低的错误率,且能显著地缩短HOG-SVM检测过程的时间。本专利技术的目的通过以下的技术方案实现:一种行人识别及定位方法,包括训练阶段和检测阶段;训练阶段具体包括以下步骤:S1.1、制作正样本集和负样本集;S1.2、从正负样本集里提取HOG特征,构成特征向量;S1.3、利用步骤S1.2中得到的特征向量训练线性SVM分类器;检测阶段具体包括以下步骤:S2.1、编码:图像的矩形区域可用三维向量(x,y,z)表示,其中(x,y)是输入图像中的矩形区域左上角的横纵坐标,z是矩形区域相对于正负样本集尺寸的比例;种群个体的编码方式也为(x,y,z),即每个个体对应图像的一个矩形区域,同时,保证检测窗口不超出原始图片的范围;S2.2、随机初始化第一代种群,给定种群大小NP、行人检测阈值θ;S2.3、聚类个体:利用niching策略(即小生境策略,一定意义上的分组策略)聚类种群中相似个体,将整个种群划分为若干个niches(小生境);S2.4、分布估计及产生后代:待种群划分完成后,首先对每个niche进行分布估计,得到每个niche的均值和标准差,接下来根据所得到的分布结果运用高斯分布及柯西分布,产生下一代种群;S2.5、个体筛选:在每个niche中,将新生成的个体逐个与该niche中与之最相似的个体进行比较,剔除二者适应度较低的个体;S2.6、局部搜索:以一定的概率对每个niche中适应度最高的个体进行局部搜索;S2.7、判断:如果满足结束条件则进入步骤S2.8,否则返回到步骤S2;S2.8、个体筛选:将种群里满足阈值条件的个体提取出来组成一个新的集合,并移除集合中区分度较小的个体;S2.9、根据步骤S2.8中的构成的集合中的个体携带的信息,标记出图中的包含行人的矩形区域;S2.10、输出:输出标记有包含行人区域的图片。优选地,所属步骤S1.1中,将行人从包含行人的图片集中裁剪出来,调整尺寸,构成正样本集;将不包含行人的区域裁剪出来、调整尺寸,构成负样本集。优选的,所述步骤S2.2中,随机产生第一代种群的公式为:其中,d表示维度,取1,2,3;xi是种群中的第i个个体;和分别是第d维的最大值、最小值,其中三维的最小值皆为0;rand()随机生成在[0,1)内的实数。优选的,所述步骤S2.3中的niching策略具体步骤为:S2.3.1、随机在种群中挑选一个还没被选中的个体;S2.3.2、从剩下的种群中挑选出NS-1个距离被选出的个体距离最近的个体,并将它们组成一个niche,NS表示niche大小;S2.3.3、若所有个体皆已被划分完成,则niching策略结束,否则跳回步骤S2.3.1继续划分剩下的个体。优选的,所述步骤S2.4产生下一代种群的具体方法为:其中Cj为第j个niche产生的后代,μj和δj是第j个niche的均值及标准差,rand()随机生成在[0,1)内的实数。优选的,所述步骤S2.6只对当前niche适应度最高的个体进行局部搜索,即在通过迭代多次利用高斯分布生成新个体,每次将得到的新个体与当前最优的个体相比较,保留适应度更高的个体:LCj=Gaussian(NBj,σ),ifrand()<pi其中本文档来自技高网
...

【技术保护点】
1.一种行人识别及定位方法,其特征在于,包括训练阶段和检测阶段;训练阶段具体包括以下步骤:S1.1、制作正样本集和负样本集;S1.2、从正负样本集里提取HOG特征,构成特征向量;S1.3、利用步骤S1.2中得到的特征向量训练线性SVM分类器;检测阶段具体包括以下步骤:S2.1、编码:图像的矩形区域可用三维向量(x,y,z)表示,其中(x,y)是输入图像中的矩形区域左上角的横纵坐标,z是矩形区域相对于正负样本集尺寸的比例;种群个体的编码方式也为(x,y,z),即每个个体对应图像的一个矩形区域,同时,保证检测窗口不超出原始图片的范围;S2.2、随机初始化第一代种群,给定种群大小NP、行人检测阈值θ;S2.3、聚类个体:利用niching策略聚类种群中相似个体,将整个种群划分为若干个niches;S2.4、分布估计及产生后代:待种群划分完成后,首先对每个niche进行分布估计,得到每个niche的均值和标准差,接下来根据所得到的分布结果运用高斯分布及柯西分布,产生下一代种群;S2.5、个体筛选:在每个niche中,将新生成的个体逐个与该niche中与之最相似的个体进行比较,剔除二者适应度较低的个体;S2.6、局部搜索:以一定的概率对每个niche中适应度最高的个体进行局部搜索;S2.7、判断:如果满足结束条件则进入步骤S2.8,否则返回到步骤S2;S2.8、个体筛选:将种群里满足阈值条件的个体提取出来组成一个新的集合,并移除集合中区分度较小的个体;S2.9、根据步骤S2.8中的构成的集合中的个体携带的信息,标记出图中的包含行人的矩形区域;S2.10、输出:输出标记有包含行人区域的图片。...

【技术特征摘要】
1.一种行人识别及定位方法,其特征在于,包括训练阶段和检测阶段;训练阶段具体包括以下步骤:S1.1、制作正样本集和负样本集;S1.2、从正负样本集里提取HOG特征,构成特征向量;S1.3、利用步骤S1.2中得到的特征向量训练线性SVM分类器;检测阶段具体包括以下步骤:S2.1、编码:图像的矩形区域可用三维向量(x,y,z)表示,其中(x,y)是输入图像中的矩形区域左上角的横纵坐标,z是矩形区域相对于正负样本集尺寸的比例;种群个体的编码方式也为(x,y,z),即每个个体对应图像的一个矩形区域,同时,保证检测窗口不超出原始图片的范围;S2.2、随机初始化第一代种群,给定种群大小NP、行人检测阈值θ;S2.3、聚类个体:利用niching策略聚类种群中相似个体,将整个种群划分为若干个niches;S2.4、分布估计及产生后代:待种群划分完成后,首先对每个niche进行分布估计,得到每个niche的均值和标准差,接下来根据所得到的分布结果运用高斯分布及柯西分布,产生下一代种群;S2.5、个体筛选:在每个niche中,将新生成的个体逐个与该niche中与之最相似的个体进行比较,剔除二者适应度较低的个体;S2.6、局部搜索:以一定的概率对每个niche中适应度最高的个体进行局部搜索;S2.7、判断:如果满足结束条件则进入步骤S2.8,否则返回到步骤S2;S2.8、个体筛选:将种群里满足阈值条件的个体提取出来组成一个新的集合,并移除集合中区分度较小的个体;S2.9、根据步骤S2.8中的构成的集合中的个体携带的信息,标记出图中的包含行人的矩形区域;S2.10、输出:输出标记有包含行人区域的图片。2.根据权利要求1所述的行人识别及定位方法,其特征在于,所属步骤S1.1中,将行人从包含行人的图片集中裁剪出来,调整尺寸,构成正样本集;将不包含行人的区域裁剪出来、调整尺寸,构成负样本集。3.根据权利要求1所述的行人识别及定位方法,其特征在于,所述步骤S2.2中,随机产生第一代种群的公式为:其中,d表示维度,取1,2,3;xi是种群中的第i个个体;和分别是第d维的最大值...

【专利技术属性】
技术研发人员:张军陈伟能詹志辉余维杰
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1