当前位置: 首页 > 专利查询>天津大学专利>正文

一种基于多分辨率框架的物体识别检测方法技术

技术编号:3955835 阅读:348 留言:0更新日期:2012-04-11 18:40
本发明专利技术属于计算机视觉领域,涉及一种基于多分辨率框架的物体识别检测方法,包括下列步骤:将快速鲁棒性特征描述符(SURF)与文本分类中常用的简单模型Bag-of-word(词袋模型)模型和SVM(支持向量机)相结合,构造了基于SURF特征的有监督学习二元物体分类器;在上述分类器的基础上,将基于SURF特征的SVM分类器与图像的多分辨率理论结合,在不同的分辨率空间下进行物体的检测。本发明专利技术能够有效解决物体识别和检测中所面临的尺度变化、旋转变化、平移变化、光照变化、视角变化等带来的问题,在多分辨率物体检测框架下,可以有效解决使用滑动窗口方法带来的物体检测时间过长的问题,准确并快速的检测到物体的位置。

【技术实现步骤摘要】

本专利技术属于计算机视觉领域,涉及一种物体识别检测方法。技术背景 本专利技术中涉及到的
技术介绍
有(1).快速鲁棒性(Speeded Up Robust Features, SURF)图像局部特征描述符(见 文献) :SURF具有尺度及旋转不变,对于光照变化具有很好鲁棒性的特征,而且相比于 其他局部特征,这种特征采取了不同的特征提取方式,增加了特征的提取速度,同时降低了 描述的维数,并且具有较好的特征特异性,达到很好的识别率,近几年在计算机视觉的多个 方面得到了应用。(2).在众多物体识别检测算法中,基于有监督学习的物体检测算法能够准确快速 地检测出图像中想要类别的物体,而并不把其他类别的物体检测出来,即在检测的同时识 别物体,而且这种物体检测算法能够对单张图像进行物体检测,对于复杂场景也能取得比 较好的检测效果。例如,AgarwaK见文献)等人提出使用Forstner感兴趣点检测子检 测图像特正,然后通过SnoW(Sparse Network of Winnows)学习框架训练分类器,利用该分 类器形成多尺度空间的分类活动图,通过分析活动图实现物体的检测。Dalal(见文献) 等人提出利用梯度方向柱状图,结合SVM分类器实现人脸的检测,并达到很好的效果。但是 这些算法依然面临很多的问题和挑战,如尺度变化、旋转变化、平移变化、光照变化、视角变 化等问题。
技术实现思路
本专利技术的目的在于客服现有技术的上述不足,提供一种能够在具有尺度变化、视 角变化、旋转变化、亮度变化、部分遮挡等复杂条件下准确并快速的检测到物体位置的物体 识别检测方法。为此,本专利技术采用如下的技术方案,包括构造多分辨率框架分类器和多 分辨率框架下物体检测两部分,步骤如下第一步分别选择所要分类物体的正负样本图像,正样本为所要分类别的物体图 像,负样本为非该类物体的任意其他物体图像,设原始图像分辨率为R,构造用于分类器的 训练集T(R),;第二步将训练集T(R)分别作不同采样率σ的采样,得到图像的分辨率分别为r =1,2,3……R的各个分辨率下的图像训练集合T(r);第三步按照下列方法得到物体分类器C (r),最终得到一个包含各个分辨率的层 次分类器H(r),H(r)是由R个单独的分类器C(r)构成从图像训练集合T(r)中,分别提取正样本和负样本中所有图像的SURF特征描述 符,正负样本特征描述符分别存储两个集合之中;(b)利用K-means聚类方法,对正负样本 集的特征描述符进行聚类分析;(c)将正负样本集合的聚类结合,形成图像特征词典;(d)根据正负样本集合在聚类中的索引,求出每幅图像聚类直方图,并根据正负样本对应相应的标签,将直方图数据和标签进行支持向量机训练,得到分辨率r下的分类器C(r);第四步将待检测的图像根据多分辨率分类器的构造流程分别提取R个分辨率不 同分辨率的图像,然后对不同分辨率的测试图像再依次提取不同尺度S的多尺度图像,s = 1,2,3……S,尺度因子为β ;第五步在每个分辨率图像的各个尺度空间使用相同大小的窗口进行检测,在不 同分辨率之间窗口使用不同的窗口进行检测,每个分辨率的窗口大小为(^,hr) = (w, h)/ ah,w, h分别是原始分辨率窗口的长和宽,a是固定常数;第六步对于每个分辨率r和尺度s,所有初始检测窗口的状态全部初始化为1,使 用分类器C(r)以同样窗口大小检测分辨率r的各个尺度空间图像,在尺度空间s上,将检 测为0,即不包含物体的窗口区域丢弃,将检测为1即包含物体的窗口区域保留,传递到r+1 分辨率同一尺度空间s中去,依次进行,直到检测到最高分辨率R,得到最高分辨率R中不同 尺度空间s包含物体的区域;第七步在原始分辨率下R各个尺度空间通过使用Mean-shift聚类的方法来得到 物体的最终位置。作为优选实施方式,其中第三步的步骤(b)包括下列步骤利用K-means聚类方 法,将正负样本集的特征描述符分别聚成K类,各自形成K个关键字,并且得到每幅图像中 特征描述符的聚类索引,即每个特征符存在哪个聚类当中,同时记下每个聚类中心的中心数值。本专利技术通过总结当前主要的物体识别检测技术的优缺点和适用范围,根据目前在 物体分类识别中有比较好性能的图像局部特征描述符的特点,构造了一种基于局部特征描 述符的物体分类器,并根据现有的物体检测技术的实现算法中面临的问题,提出了一种在 图像多分辨率框架下利用物体分类器逐区域进行物体检测的方法,得到很好的目标识别检 测效果。本专利技术能够有效解决物体识别和检测中所面临的尺度变化、旋转变化、平移变化、 光照变化、视角变化等带来的问题,在多分辨率物体检测框架下,可以有效解决使用滑动窗 口方法带来的物体检测时间过长的问题,准确并快速的检测到物体的位置。附图说明图1基于多分辨率框架的物体识别检测方法总体流程图;图2 的(a)、(b) (c) (d) (e) (f)图像分别为 σ = 0,1,4,16,64,256 的多尺度表示;图3多分辨率框架;图4 (a)、(b)分别为640 X 480分辨率下多分辨率物体检测效果和传统方法检测效果。表1单分辨率物体检测和多分辨率物体检测时间对照表。 具体实施例方式本专利技术提出了基于多分辨率框架的物体识别检测方法,将快速鲁棒性特征描述符 (SURF)结合文本分类中常用的简单模型Bag-of-word(词袋模型)模型和SVM(支持向量 机)相结合,构造了基于SURF特征的有监督学习二元物体分类器;在上述分类器的基础上,将基于SURF特征的SVM分类器与图像的多分辨率理论结合,在不同的分辨率空间下进行物 体的检测。本专利技术能够有效解决物体识别和检测中所面临的尺度变化、旋转变化、平移变 化、光照变化、视角变化等带来的问题,在多分辨率物体检测框架下,可以有效解决使用滑 动窗口方法带来的物体检测时间过长的问题,准确并快速的检测到物体的位置。本专利技术是基于多分辨率框架的物体识别检测方法,图1为总体流程图,具体包括 以下步骤1.多分辨率框架分类器的构造;以下是多分辨率框架下的快速鲁棒性特征分类器流程(1).选取用于分类器构造的训练集和测试集。从一个图像数据库(对于本 专利技术的物体检测算法主要使用ETH-80,CaltechlOl和The PASCAL Visual Object ClassesChallenge 2006三种数据库,具体见参考文献、和)中分别选择所要分 类物体的正负样本图像,对于物体检测系统,正样本一股采用只包含该类物体的图像,尽可 能少的包含背景,以减少背景的干扰,正样本集构造时可以进行预处理,将正样本做一些手 动分割,只提取图像中的物体图像作为正样本,负样本一股采用不包含物体只包含背景的 图像或者包含其他物体的图像;(2).设图像的分辨率分别为r = 1,2,3……R,R为原始图像分辨率,图像的采样 率为σ,将原分辨率R下的训练集T (R)分别作不同采样率σ的采样(可以采用简单的隔 行采样,采样率σ = 0. 5)得到各个分辨率下的图像集合T(r),这些图像集合分别成为各个 分辨率下的训练集,这样构成了多个训练集合;(3).在各个分辨率r下,分别提取各个训练集T (r)中每个图像的SURF特征和特 征符,通过Bag-of-word模型和SVM本文档来自技高网...

【技术保护点】
一种基于多分辨率框架的物体识别检测方法,包括构造多分辨率框架分类器和多分辨率框架下物体检测两部分,步骤如下:第一步:分别选择所要分类物体的正负样本图像,正样本为所要分类别的物体图像,负样本为非该类物体的任意其他物体图像,设原始图像分辨率为R,构造用于分类器的训练集T(R),;第二步:将训练集T(R)分别作不同采样率σ的采样,得到图像的分辨率分别为r=1,2,3……R的各个分辨率下的图像训练集合T(r);第三步:按照下列方法得到物体分类器C(r),最终得到一个包含各个分辨率的层次分类器H(r),H(r)是由R个单独的分类器C(r)构成:从图像训练集合T(r)中,分别提取正样本和负样本中所有图像的SURF特征描述符,正负样本特征描述符分别存储两个集合之中;(b)利用K-means聚类方法,对正负样本集的特征描述符进行聚类分析;(c)将正负样本集合的聚类结合,形成图像特征词典;(d)根据正负样本集合在聚类中的索引,求出每幅图像聚类直方图,并根据正负样本对应相应的标签,将直方图数据和标签进行支持向量机训练,得到分辨率r下的分类器C(r);第四步:将待检测的图像根据多分辨率分类器的构造流程分别提取R个分辨率不同分辨率的图像,然后对不同分辨率的测试图像再依次提取不同尺度s的多尺度图像,s=1,2,3……S,尺度因子为β;第五步:在每个分辨率图像的各个尺度空间使用相同大小的窗口进行检测,在不同分辨率之间窗口使用不同的窗口进行检测,每个分辨率的窗口大小为(w↓[r],h↓[r])=(w,h)/a↑[R-r],w,h分别是原始分辨率窗口的长和宽,a是固定常数;第六步:对于每个分辨率r和尺度s,所有初始检测窗口的状态全部初始化为1,使用分类器C(r)以同样窗口大小检测分辨率r的各个尺度空间图像,在尺度空间s上,将检测为0,即不包含物体的窗口区域丢弃,将检测为1即包含物体的窗口区域保留,传递到r+1分辨率同一尺度空间s中去,依次进行,直到检测到最高分辨率R,得到最高分辨率R中不同尺度空间s包含物体的区域;第七步:在原始分辨率下R各个尺度空间通过使用Mean-shift聚类的方法来得到物体的最终位置。...

【技术特征摘要】

【专利技术属性】
技术研发人员:张加万付磊张怡高中杰
申请(专利权)人:天津大学
类型:发明
国别省市:12[中国|天津]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1