训练装置、训练方法及检测方法制造方法及图纸

技术编号:4315320 阅读:215 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了训练装置、训练方法及检测方法,其中,该训练装置包括:样本采集单元,用于采集预定数目的物体图像集和背景图像集;特征提取单元,用于提取由样本采集单元采集的物体图像集和背景图像集的特征;以及训练单元,用于使用由特征提取单元提取的特征进行训练,以获得分类器,其中,特征包括类小波特征和梯度方位直方图特征。分类器采用了特定的级联结构,将Haar-like特征与HOG特征结合在一起使用,同时发挥了Haar-like特征计算快捷和HOG特征分辨力强大的优势,在不显著增加计算成本的同时大大提高了所获得的分类器的性能。

【技术实现步骤摘要】

本专利技术涉及物体检测技术,尤其涉及在静态图像或视频图像中 确定是否存在物体并给出物体在图像或视频中的位置的训练装置、 训练方法及4企测方法。
技术介绍
在图像和视频中进行物体检测的技术使用各种特征训练分类 器,试图在图像和视频中找到大小和外观各异的物体的位置和尺寸。以汽车为例,汽车4企测4支术是物体4企测领域的一个分支,许多术所面临的问题是多种多样的,例如汽车包括各种不同的种类(轿 车、卡车、巴士等),而车与车之间又存在外MJi的细樣i差别;遮 挡也是一个十分普遍的问题,遮挡可能在各种情况下发生,被遮挡 的可能是汽车的任意部分;以及光影的变化可能使得同一辆车呈现 不确定的外观,而视角的变化所引起的成像差异则使得检测空间变 得更加庞大。在图像和视频中检测汽车的技术主要包括所使用的特征、分类 器的设计和检测器的设计三个部分。目前在物体才企测:技术中已经出现多种多才羊的特征,例如角点 (Corner)、边缘、图像块(Patch)、特征点描述子、小波或类小波 (Haar國like)、冲弟度方4立直方图(Histogram of Oriented Gradient,HOG)等。Patch和特4正点描述子是4交为底层的特征,它们对所牙全 测物体的描述比较直接,当物体的类内差异较大时其鲁棒性较差; Haar-like特征和HOG等则是相对抽象一些的特征,其计算可以在 多个尺度上进行,从而对物体的类内差异有更好的适应性。目前, 大多数特征在使用时都有十分固定的位置参数,即隐含特征在图像 中的位置信息,但同时也使得特征对视角的变化更为敏感。另夕卜, 大多数特征都是在图像样本的某个局部区域上进行计算,而没有考 虑多个同类特征之间进行融合的情况,不同种类特征的同时使用也 鲜有讨论。分类器的"i殳计大致可以分为以下几种方式将所4企测的目标作 为一个整体看待,将所用到的特征进行组合,然后使用单一分类器 (例如,支持向量机、朴素贝叶斯分类器等)进行分类;将物体看 作由多个"部分,,构成,分类器的设计为两级,第一级的多个局部分 类器分别用于4全测物体的各个"部分",所有第一级分类器的输出作 为第二级分类器的输入来判断是否有整体的存在;以及仍然将物体 看作整体,但分类器作多级(两级以上)设计,每级分类器(一般 使用Adaboost方法)均负责一部分负样本的剔除,能够通过所有级 分类器的样本才能被归为正样本,这就是著名的级联(Cascade )结 构。然而,上述三种方式都存在在一定的缺点。对于第一种方式来 说,由于将目标作为一个整体来看待,所以在进行测试时处理速度 相只于比4交'f曼。第二种方式与其<也两种相比》寸遮挡有更好的适应性, ^旦多个局部分类器的4吏用产生了更多的虚々l响应,/人而带来了新的 问题。第三种方式的逐级淘汰才莫式大大缩4豆了冲企测时间,因:t匕^寻到 了更多的应用,4旦其计算比專交复杂。分类器的"i殳计完成后,就可以 搜集正负样本进行分类器的训练,从而确定分类器的参数。检测器的主体部分是如何使用训练好的分类器,在使用分类器 时一般有两种方式。第一种是逐步缩小图像的尺寸,每改变一次图 像的尺寸,都使用固定尺寸的窗口按照一定的顺序遍历图像,将每次所得窗口内的图像部分输入分类器进行分类;第二种是不改变图 像的尺寸,而逐步扩大窗口的尺寸,使用不同尺寸的窗口遍历图像。 第一种方式是尽量保持检测过程与训练过程中的条件相当,因此可 能保证分类器的性能得到最大发挥,第二种方式可能会降低分类器 的性能,但可以大大加快检测的速度。分类器会对图像中某个特定 的才莫式产生多重响应,如^f可合并和去除这些响应^皮称为后处理问 题。在分类器的训练和检测中,为了加速过程的进行,积分图像技 术被大量使用。检测器的最终性能取决于训练样本的挑选、所使用 的特4正、分类器的i殳计和训练、4企测窗口的产生方式和遍历方式以 及后处理等多重因素。衡量检测性能的指标包括检测率(所有正样本中被正确4全测出 的数量)、误检率(被误当作正样本检测出的负样本占检测总窗口 的比率)、检测精度(所有实际检测出的样本中,正样本所占的比 例)等。检测率和检测精度越高,误检率越低,检测性能越好。为 了对检测性能进行比较完整的衡量,通常会进行多次实验并产生系 统的运行特性曲线或检测精度对比曲线,根据曲线的形状进行更准 石角的比车交。尽管已经存在各种各样在图形中检测汽车的方法,但其检测性 能仍然存在很大的提升空间。更好的方法可以通过变更特征或变更 特征的^f吏用方式、改进分类器的结构、减少训练时间和才企测时间等 多种途径获得。Haar-like特征和HOG特征是两种得到广泛关注的特征,它们 都在Cascade分类器结构下得到应用,同时获得了不4晉的性能和枱r 测速度。10Haar-like特征的优势是可以方便的构建积分图像,计算简单快 速,能够快速的进行训练;^^测时采用逐级扩大才企测窗口而不是缩 小图像的方式获得了更快的速度,但是这种逐级扩大检测窗口的方 式会略微降低检测率。另一方面,Haar-like特征是一种较弱的特征, 在Cascade分类器的训练中为了降低误检率而使用了很多级分类 器,但这也同时降低了分类器的检测率。与Haar-like特征相比,HOG特征是一种较强的特征,其计算 也更复杂,因此训练使用HOG特征的Cascade分类器所需要的时 间比训练具有相似性能的使用Haar-like特征的Cascade的时间多的多。综上所述,需要能够获得更少的训练时间成本和更好的检测性 能的训练装置、训练方法禾口;险测方法。
技术实现思路
本专利技术的目的在于解决现有技术中所存在的问题。根据本专利技术的一个方面,提供了一种训练装置,用于通过训练 获得用于区分物体和背景的分类器,该训练装置包括样本采集单 元,用于采集预定数目的物体图像集和背景图像集;特征提取单元, 用于提取由样本采集单元采集的物体图像集和背景图像集的特征; 以及训练单元,用于使用由特征提取单元提取的特征进行训练,以 获得分类器,其中,特征包括类小波特征和梯度方位直方图特征。在上述训练装置中,分类器采用由多个级分类器串联而成的级 联结构,每一个级分类器均包括第一子级分类器,使用类小波特 征;以及第二子级分类器,使用梯度方位直方图特征,其中,第一 子级分类器和第二子级分类器串联连接。优选地,第 一子级分类器的训练在所述第二子级分类器的训练 之前,并且将第二子级分类器的期望检测率在训练之前被预先设为100%。在训练第n个级分类器时,训练第n个级分类器中的第一子级分类器所需的正样本集和负样本集通过样本搜索分类器在物体图 像集和背景图像集中搜索而得到,其中,样本搜索分类器由前n-1个级分类器中的第一子级分类器所组成;以及训练第n个级分类器 中的第二子级分类器的负样本集与第n个级分类器中的第一子级分类器所使用的负样本集相同,而第n个级分类器中的第二子级分类 器的正样本集为样本搜索分类器在物体图像集中搜索得到的正样 本集被训练得到的第n个级分类器中的第 一子级分类器重新筛选后 的正样本集。样本搜索分类器对物体图像集中的图像进行分类,所有被分类 为正样本的图像组成训练第n个级分类器中的第 一子级分类器所需 的正样本集。使用本文档来自技高网
...

【技术保护点】
一种训练装置,用于通过训练获得用于区分物体和背景的分类器,其特征在于,所述训练装置包括: 样本采集单元,用于采集预定数目的物体图像集和背景图像集; 特征提取单元,用于提取由所述样本采集单元采集的所述物体图像集和所述背景图像集的特 征;以及 训练单元,用于使用由所述特征提取单元提取的所述特征进行训练,以获得所述分类器, 其中,所述特征包括类小波特征和梯度方位直方图特征。

【技术特征摘要】

【专利技术属性】
技术研发人员:梅树起吴伟国
申请(专利权)人:索尼中国有限公司
类型:发明
国别省市:11[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1