一种基于随机森林支持向量机的行人识别系统及处理方法技术方案

技术编号:12398192 阅读:70 留言:0更新日期:2015-11-26 03:55
本发明专利技术涉及一种基于随机森林支持向量机的行人识别系统,包括特征提取模块、聚类模块、随机森林创建模块和评分模型模块,本发明专利技术还涉及一种基于随机森林支持向量机的行人识别处理方法;本发明专利技术用相似度排名方式代替了以往的相似度绝对值的比较,无需划定阈值,得出的排名结果便于使用者自己判断;建立随机森林模型需要多特征,仅从表观特征无法人工将样本们分类完善,采用K-means聚类算法代替人工给出样本类别,可以挖掘出样本间的潜在联系;该系统及方法对行人姿态变化具有鲁棒性,在计算相似度的时候会排除来自其他几类样本的干扰,RankSVM的排名结果也会靠前,进行相似度计算时,会使得识别准确率提升,相比MCC与RankSVM等现有技术列举的传统算法识别准确率高。

【技术实现步骤摘要】

本专利技术涉及智能监控的行人识别
,尤其涉及。
技术介绍
行人识别是模式识别领域中活跃的研究方向之一。在行人检索和识别中,随着样本库的加大,检索识别一幅图像的速度和准确率都受到较大的影响。行人特征提取方面,RGB、HSV等颜色直方图信息被广泛使用,但是易受环境影响。Gabor小波提取行人纹理特征,但是当提取不到准确的边界曲线时候,最终得到的纹理特征会有很大变化。LBP提取纹理特征对光照有鲁棒性但是在行人姿态发生很大变化时,仅从LBP提取到的纹理特征识别行人目标准确率会很低。此外,在相似度计算方面随着样本库的加大,测试图像面对的负样本加大,与测试图像具有相仿特征的样本出现概率加大,这都会影响到测试结果的准确性,即使RankSVM计算相似度排名顺序,并未给出相似度绝对值,而是排序结果供使用者自己判断,可随着样本加大,干扰样本出现概率大,正样本的排名顺序也会靠后。
技术实现思路
本专利技术所要解决的技术问题是提供,用相似度排名方式代替了以往的相似度绝对值得比较,无需划定阈值,得出的排名结果便于使用者自己判断,采用K-means聚类算法代替人工给出样本类别,可以挖掘出样本间的潜在联系。本专利技术解决上述技术问题的技术方案如下:一种基于随机森林支持向量机的行人识别系统,包括特征提取模块、聚类模块、随机森林创建模块和评分模型模块;所述特征提取模块,用于从各图像人物样本中提取颜色特征信息和纹理特征信息,并将各图像人物样本中的各颜色特征和纹理特征用多维特征向量的形式表示;所述聚类模块,用于根据K-means聚类算法对所有图像人物样本的多维特征向量进行聚类处理,得到类别矩阵;K-means算法的思想是:首先随机选取几个数据点作为聚类中心点,其次将每个数据都聚类到最近的聚类中心点,最后计算每个类的重心,如果重心到聚类中心点的距离大于给定阈值,就以重心为此类的聚类中心点继续聚类,直至类的重心到聚类中心点的距离小于阈值;所述随机森林创建模块,用于根据所述多维特征向量和类别矩阵建立随机森林模型,再通过所述随机森林模型对待测试人物图像进行特征预测,得到预测类别号;所述评分模型模块,用于通过RankSVM排序算法对图像人物样本进行训练,得到评分模型,再通过所述评分模型根据所述预测类别号对待测试人物图像进行识别、评分和排序,得到待测试人物图像相似度排名。本专利技术的有益效果是:用相似度排名方式代替了以往的相似度绝对值的比较,无需划定阈值,得出的排名结果便于使用者自己判断;建立随机森林模型需要多特征,仅从表观特征无法人工将样本们分类完善,采用K-means聚类算法代替人工给出样本类别,可以挖掘出样本间的潜在联系。 在上述技术方案的基础上,本专利技术还可以做如下改进。进一步,所述评分模型模块包括模型构建单元和评分单元,所述模型构建单元,用于将所述图像人物样本的多维特征向量通过RankSVM排序算法进行训练,得到评分模型;所述评分单元,用于通过评分模型按所述预测类别号对待测试人物图像进行识别并评分,将识别到的结果根据评分大小进行排列,得到待测试人物图像相似度排名。采用上述进一步方案的有益效果是:仅在预测到的预测类别号中使用评分模型(即利用RankSVM排序算法)进行识别、评分、排列,使得到的排名结果既准确又相对单一。进一步,所述随机森林模型包括多个决策树,每个决策树对待测试人物图像进行特征预测时,分别给出预测值,若该预测值出现次数最多则得到该特征的预测分类号。随机森林自动创建决策树群,但是大部分的决策树对于分类没有意义,每个节点用了不相关的特征作出判断,最终一棵决策树分出了两类。当做预测的时候,新的观察到的特征随着决策树自上而下走下来,这样一组观察到的特征将会被贴上一个预测值。一旦森林中的每棵树都给出了预测值,所有的预测结果将被汇总到一起,所有树的模式投票被返回做为最终的预测结果。这些貌似没有意义的决策树做出的预测结果涵盖所有情况,这些预测结果将会彼此抵消,而占少数的那些优秀的树的预测结果将会脱颖而出,做出一个好的预测。随机森林是由一群决策树构成,每棵决策树都随机的从输入样本中选取固定数量的样本数据存入根节点,一般是样本数据量的10%,每次二叉分都随机的选取少量特征作为依据进行判断,操作时可选取三类特征预测分类号。采用上述进一步方案的有益效果是:K_means聚类算法结合随机森林起到一个对样本数据初筛的作用。进一步,所述颜色特征信息包括RGB、HSV和YCBCR颜色空间的特征信息;对所述纹理特征信息的提取通过Gabor小波算法和LBP算法进行提取;Gabor小波提取各样本的纹理特征,LBP算法提取样本中人物上衣的纹理特征。采用上述进一步方案的有益效果是:识别出各图像人物样本中具有显著特征的特征信息。进一步,所述随机森林创建模块根据K-means聚类算法对所有图像人物样本的多维特征向量进行聚类处理,得到类别矩阵,所述类别矩阵为聚五类。采用上述进一步方案的有益效果是:类别矩阵为聚五类,效果更直观。本专利技术解决上述技术问题的另一技术方案如下:一种基于随机森林支持向量机的行人识别处理方法,包括如下步骤:步骤S1:从各图像人物样本中提取颜色特征信息和纹理特征信息,并将各图像人物样本中的各颜色特征和纹理特征用多维特征向量的形式表示;步骤S2:根据K-means聚类算法对所有图像人物样本的多维特征向量进行聚类处理,得到类别矩阵;步骤S3:根据所述多维特征向量和类别矩阵建立随机森林模型,再通过所述随机森林模型对待测试人物图像进行特征预测,得到预测类别号;步骤S4:通过RankSVM排序算法对图像人物样本进行训练,得到评分模型,再通过所述评分模型根据所述预测类别号对待测试人物图像进行识别、评分和排序,得到待测试人物图像相似度排名。在上述技术方案的基础上,本专利技术还可以做如下改进。进一步,实现所述步骤S4的具体步骤为:步骤S4.1:将所述图像人物样本的多维特征向量通过RankSVM排序算法进行训练,得到评分模型;步骤S4.2:通过评分模型按所述预测类别号对待测试人物图像进行识别并评分,将识别到的结果根据评分大小进行排列,得到待测试人物图像相似度排名。进一步,所述随机森林模型包括多个决策树,每个决策树对待测试人物图像进行特征预测时,分别给出预测值,若该预测值出现次数最多则得到该特征的预测分类号。进一步,所述颜色特征信息包括RGB、HSV和YCBCR颜色空间的特征信息;对所述纹理特征信息的提取通过Gabor小波算法和LBP算法进行提取。进一步,述步骤S2中根据K-means聚类算法对所有图像人物样本的多维特征向量进行聚类处理,得到类别矩阵,所述类别矩阵为聚五类。基于VIPeR样本库的实验证明,该方法对行人姿态变化具有鲁棒性,在计算相似度的时候会排除来自其他几类样本的干扰,同时也充分利用了同一行人的多个特征间的潜在联系,RankSVM的排名结果也会靠前,综合多特征实现将正样本和测试目标归到同一类的目的。在此基础上进行相似度计算,会使得识别准确率提升,相比MCC与RankSVM等现有技术列举的传统算法识别准确率高。【附图说明】[0当前第1页1 2 3 本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/CN105095884.html" title="一种基于随机森林支持向量机的行人识别系统及处理方法原文来自X技术">基于随机森林支持向量机的行人识别系统及处理方法</a>

【技术保护点】
一种基于随机森林支持向量机的行人识别系统,其特征在于,包括特征提取模块(1)、聚类模块(2)、随机森林创建模块(3)和评分模型模块(4);所述特征提取模块(1),用于从各图像人物样本中提取颜色特征信息和纹理特征信息,并将各图像人物样本中的各颜色特征和纹理特征用多维特征向量的形式表示;所述聚类模块(2),用于根据K‑means聚类算法对所有图像人物样本的多维特征向量进行聚类处理,得到类别矩阵;所述随机森林创建模块(3),用于根据所述多维特征向量和所述类别矩阵建立随机森林模型,再通过所述随机森林模型对待测试人物图像进行特征预测,得到预测类别号;所述评分模型模块(4),用于通过RankSVM排序算法对图像人物样本进行训练,得到评分模型,再通过所述评分模型根据所述预测类别号对待测试人物图像进行识别、评分和排序,得到待测试人物图像相似度排名。

【技术特征摘要】

【专利技术属性】
技术研发人员:蔡晓东王迪杨超甘凯今王丽娟陈超村刘馨婷吕璐赵秦鲁宋宗涛
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:广西;45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1