面向变化场景的远红外行人检测方法技术

技术编号:10813765 阅读:115 留言:0更新日期:2014-12-24 18:26
本发明专利技术公开面向变化场景的远红外行人检测方法,该方法基于Boosting-style的归纳迁移学习算法DTLBoost,从辅助数据中筛选样本扩展目标数据集。首先利用基于k近邻的样本重要性度量模型评估辅助数据与目标数据之间的相似度,为辅助数据中的不同样本分配相应的初始权重。在训练过程中,显式地定义成员分类器的预测不一致性程度,并结合当前成员分类器的预测错误率对辅助数据和目标数据样本的当前权重进行迭代更新,从辅助数据中筛选出具有正迁移能力的样本扩展训练集,并鼓励不同成员分类器学习目标数据的不同部分或方面。从而训练出泛化能力更强的集成分类器,增强新场景中行人检测的鲁棒性。

【技术实现步骤摘要】
【专利摘要】本专利技术公开,该方法基于Boosting-style的归纳迁移学习算法DTLBoost,从辅助数据中筛选样本扩展目标数据集。首先利用基于k近邻的样本重要性度量模型评估辅助数据与目标数据之间的相似度,为辅助数据中的不同样本分配相应的初始权重。在训练过程中,显式地定义成员分类器的预测不一致性程度,并结合当前成员分类器的预测错误率对辅助数据和目标数据样本的当前权重进行迭代更新,从辅助数据中筛选出具有正迁移能力的样本扩展训练集,并鼓励不同成员分类器学习目标数据的不同部分或方面。从而训练出泛化能力更强的集成分类器,增强新场景中行人检测的鲁棒性。【专利说明】
本专利技术涉及行人检测
,具体为一种面向变化场景的远红外行人检测方 法。
技术介绍
训练数据与测试数据之间通常存在不可避免的数据分布差异性,这是导致多数基 于机器学习的远红外行人检测方法在场景因素变化较大时表现得不够理想的主要原因之 一。具体来说,一般行人检测方案中采用的传统机器学习算法默认满足下述基本假设:训练 数据和测试数据独立同分布,即训练数据和测试数据通常来源于相似甚至相同的场景。当 这个基本假设得不到满足的时候,这类基于传统机器学习算法的远红外行人检测方案通常 难以成功应用。 然而,在针对不同应用场合的行人检测系统中,由于测试视频数据中潜在的场景 差异性,训练数据和测试数据之间存在的数据分布差异性通常难以避免。产生这类差异性 的主要因素包括:不同的气候条件(行人衣着和/或环境随温度的改变而改变,由此将影响 行人散发的热辐射能量、以及热辐射能量被远红外摄像头接吸收的幅度)以及、不同的摄 像头配置方案(如视角的变化将显著影响目标的外观模式)等。因此,为了适时应对新场景 中潜在的未知远红外行人模式,需要从新场景中重新收集规模充足的训练数据(规模不充 分的训练数据容易造成过拟合问题从而影响分类器的泛化能力),重新训练适合新场景的 行人分类器。但是这种传统方案需要标记足够多的适时训练数据而存在高标记成本问题, 而且当其他新场景出现时,这种无止境的高代价方案明显阻碍高效率远红外行人检测系统 的建立。此外,直接抛弃原来已有的大量训练数据(即辅助数据)亦造成了资源的浪费。 以提高新场景中的行人检测性能作为学习目标,出现了大量致力于各种自适应学 习算法的研究。各种在线学习或增量学习策略被用于离线更新行人分类器。这类方案大多 利用从辅助数据中学习得到的行人分类器,在指定的新场景中搜索检测置信度较高的目标 模式(包括行人模式和背景模式)组成扩展样本集,以对行人分类器进行在线更新或者重 新训练,达到在指定新场景中准确识别/检测远红外行人目标的目的。例如,Wang等(Wang X Yj Hua Gj Han T X. Detection by detections:non-parametric detector adaptation for a video. Proceedings of IEEE Conference on Computer Vision and Pattern Recognition,2012)提出一种基于非参数估计的行人分类器自适应调整方法,建立基于层 次c均值聚类的词汇树模型收集高置信度的检测结果,并利用它们对其余低置信度的检 测结果进行排序和重组,进而获取扩展样本集。Sharma等(Sharma P,Huang C, Nevatia R. Unsupervised incremental learning for improved object detection in a video. Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, 2012) 对行人分类器获得的检测结果进行跟踪,将检测结果与跟踪结果进行匹配,正确匹配者视 为新场景中表征行人模式的样本,否则视为表征背景模式的样本。上述方法的优点在于无 需预先进行标记新场景中的目标模式,但可能面临两个重要问题:(1)扩展样本集中的样 本可能包含数据标记的噪声,直接采用带噪声的扩展样本集难以保证更新后的行人分类器 的可靠性;(2)当行人分类器泛化能力较差时,通常无法处理或收集新场景中不能被正确 检测的行人模式,因为这类行人模式并未包含在辅助数据中,也即无法通过学习获取其信 息,难以保证更新后的分类器能够有效识别新场景中的各种行人模式。 虽然目标数据(当前数据)和辅助数据(历史数据)往往服从不同的数据分布,但 这些数据通常位于同一特征空间中,彼此之间仍具有一定的关联性或相关性。具体地说,部 分辅助数据和新场景中的数据具有较高的相似性,如果能够提取具有较高相似性的辅助数 据并迁移到新场景中,将大大减少对新样本标记量的需求,促进改善新场景中的行人检测 的鲁棒性° Cao 等(Cao X B, Wang Z, Yan P K, et al. Transfer learning for pedestrian detection. Neurocomputing, 2013)利用迭代调整训练数据权重的方式,过滤辅助数据中与 目标数据相似度较低的"不利"样本,提出基于实例迁移的ITLAdaBoost算法进行未知场 景中的行人检测。Pang 等(Pang J B, Huang Q M, Yan S C,et al. Transferring boosted detectors towards viewpoint and scene adaptiveness. IEEE Transactions on Image Processing,2011)提出一种基于局部特征迁移的学习方法,解决了视频监控领域中不同 摄像头视角和变化场景中的行人检测问题,该方法利用CovBoost算法搜索辅助数据和目 标数据之间共享的局部视觉特征,并将其进行迁移从而协助行人分类器的更新。谢尧芳等 (谢尧芳,苏松志,李绍滋.基于稀疏编码的迁移学习及其在行人检测中的应用.厦门大学 学报(自然科学版),2010)提出了一种基于稀疏编码的迁移学习方法,利用稀疏编码从未 标记训练数据中学习到一个紧凑的、有效的描述特征,并将该特征迁移到行人检测问题中。 Wang等(Wang M, Li ff,ffang X G. Transferring a generic pedestrian detector towards specific scenes. Proceedings of IEEE Conference on Computer Vision and Pattern Recognition, 2012)首先建立关系图模型描述辅助数据和目标数据之间的视觉相似度,以 调整辅助数据中的样本权重,继而根据新场景中目标模式的运动信息以及所在场景的结构 信息的评估,从新场景中获取的扩展数据的置信度,最后提出整合上述信息的Confidence Encoded SVM算法来指导迁移学习。 迁移学习试图通过"举一反三"的方式,快速地将已有知识合理地关联到新的 相似的问题中,目前利用迁移学习解决变化本文档来自技高网...

【技术保护点】
面向变化场景的远红外行人检测方法,其特征在于该检测方法基于Boosting‑style的归纳迁移学习算法DTLBoost,具体包括如下步骤:(1)通过基于k近邻算法的样本重要性度量模型评估辅助数据与目标数据之间的相似性程度,为辅助数据中的不同样本分配相应的初始权重;(2)筛选训练数据集,训练成员分类器;(3)显式地定义成员分类器的预测不一致性程度,并结合当前成员分类器的预测错误率对辅助数据和目标数据样本的当前权重进行迭代更新;(4)若满足迭代终止条件,输出行人分类器,实现面向新场景的行人检测;否则,返回步骤(2)。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘琼庄家俊申旻旻
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1