图像分类方法和设备技术

技术编号:2924867 阅读:184 留言:0更新日期:2012-04-11 18:40
本公开涉及一种用于将图像分类成多个种类的方法,包括步骤:根据图像确定色彩直方图矢量以及基于色彩直方图矢量将图像分类成多个种类,其中色彩直方图矢量由从候选色彩直方图特征选择的一些色彩直方图特征组成。本方法可显著地提高图像的查全率并获得比现在方法更好的分类结果。

【技术实现步骤摘要】

本专利技术 一般地涉及图像分类方法和设备
技术介绍
近年来在机器学习和图像比较方面,研究者已经获得令人可喜的进步。在机器学习领域,Boosting、支持矢量机器和其他所谓的大 间隔(large-margin)技术不断地在当应用于老的技术时展示出改进 的性能和更为确定的机器学习方法。Adaboost是一种用于提高任意 给定学习方法精确度的通用方法。其从大的集合中选择少量的关键 特征并且产生极其有效的分类器,并且具有用于例如人脸检测的视 觉对象4全测的成功应用。关于Adaboost的解释,参见由Yoav Freund Robert E. Schapire撰写的"A Short Introduction to Boosting,,,通过参考 将其内容全部并入在此。同时,针对于图像比较,图像检索领域的研究者已经设计出新 的表示方法,其允许基于例如色彩和紋理分布的多个线索来进行图 像间的快速比较。例如色彩直方图、冗余紋理滤波器组和其他技术 已经显示出超出早期技术的重大改进。不幸地是除了 一些特殊例外,当前很少有研究通过将每个的最 佳元素进行合并来试图针对这两个领域。因此,将更新的图像分析
技术实现思路
本专利技术的目的在于提供一种图像分类方法和设备,以将图像分 类成多个种类,从而获得比现有方法更好的分类结果。为了实现上述的目的,本专利技术提供一种用于将图像分类成多个种类的方法,包括步骤根据图像确定色彩直方图矢量以及基于色 彩直方图矢量将图像分类成多个种类,其中色彩直方图矢量由从候 选色彩直方图特征选择的 一些色彩直方图特征组成。本专利技术还提供一种用于将图像分类成多个种类的设备,包括 确定模块,其用于根据图像确定色彩直方图矢量;以及分类模块, 其用于基于色彩直方图矢量将图像分类成多个种类,其中色彩直方 图矢量由从候选色彩直方图特征选择的 一些色彩直方图特征组成。由于Adaboost的效力,可以选4奪图像的关4建和有效特征并且由 此提高了计算效率。与考虑色彩样本的分布但忽略其有效性的其他 直方图算法相比,有效性也在积分图像直方图的考虑之内。总之, 本专利技术的使用可以显著提高图像的查全率并获得与现有方法更好的 分类结果。附图说明根据下面结合附图阅读的示例性的实施方式的详细描述,本发 明的上述和其他目的、特征和优势将变得明显。图1是根据本专利技术一个实施方式的一种用于将图像分类成多个 种类的方法的流程图3是图2中的Adaboost算法中的WeakLearn (弱学习)算法 的流程图4是根据本专利技术一个实施方式的一种用于将图像分类成多个 种类的设备的示意框图;以及图5示出本专利技术可在其中实施的一个实施方式的示意性应用。具体实施例方式现在参考附图对本专利技术进行更为详细地描述。图1示出根据本专利技术的一个实施方式的一种用于将图像分类成 多个种类的方法的流程图。在步骤100处,输入将要^皮分类的图像。在步骤110处,执行确定图像的色彩直方图矢量(也可由图4中的确定模块400来执行),下文将对其进行详细地描述。首先,定义一种简单但很有效的候选色彩直方图特征。其可由 下面的方程来表达化,"2,^,g2,VW^ J J J^O,g,Z))d喊必(。<g2,& <62) (1)其中;^,g,6)表示图像像素色彩的概率。符号。^,g,,&AA表示特征参数,换句话说,不同的^"2,g',&AA可产生不同的特征。图像的候选色彩直方图^^2,&,g2,VW可根据下式计算<formula>complex formula see original document page 6</formula>(2)其中M代表图像中像素的总数,而—w化I代表像素的总数,其r值大 于或等于r,而小于或等于r2, g值大于或等于g!而小于或等于g2, b值 大于或等于bi而小于或等于b2的。从理论上来说,上述的六个参数可 以是从O到255的任意值并且因此在图像中存在(257"56/2)3 =35,598,301,659'136个特征。尽管理论特征值是如此的巨大,但由于计算的限度,仅它们中的一些将用作候选特征。优选地, 。^,g,,g2AA可以是oo,3o,5o,7o,9o,uo,i3o,i5(y7oj9o,"o,23o,25o)集合中的一个值。然而,应该注意到n^,g',g^,A的值不限于这里所描述 的值,本领域技术人员可以根据实际需要设置。,^g"g^"^的值。接着,将仅有(14"3/2)3 =753571个特征用作候选色彩直方图特征。然而,753571 个特征对于本方法来说依然太大。出于进一步简化的目的,使用Adaboost算法来训练将在本方法中使用的一些特征(即,选择特征,这 也可由图4中的确定才莫块410来执行)。现在参考图2,其示出了 Adaboost算法的流程图。尽管本领域技术 人员了解Adaboost,但对其简短的描述将有助于更好的理解本专利技术。在 步骤200,输入m个训练样本,即,SM(w》,(巧,h),…U,其中输入标示y'ey-W"。这里Xi是通过由方程(2)计算的候选色彩直方图特 征&,&..1753571所组成的753571维矢量,而值仅可以分别为代表蓝天图像样本和非蓝天图像样本的0或1的力是与Xj关联的分类标记。应该注 意到使用本专利技术来将图像分类成蓝天图像和非蓝天图像仅是示例性的, 并且其可被用于将图像分类成如期望的任意种类。另外,应该注意到力 的值不限于这里所述的值,本领域技术人员还可根据实际需要来设置yi 的值。在步骤210,初始变量被设置成等于l,在步骤220,根据下式来执行Dt(i)的初始化<formula>complex formula see original document page 7</formula> (3)其中D,是第一轮的训练样本^^,少》,""h),…,"",乂""的分布并且 利用均勻分布来初始化。为了稍后的迭代而预先指定T并且在本方法中 T优选的是46。在每次迭代中基于先前Dt—,来计算随后的Dt。接着流程 图前进到迭代部分,在步骤230,调用具有误标记分布Dt的弱学习(稍 后描述)并且由此得到输出为0或1的假设ht(x)。输入样本的分类取决 于ht(x)的输出,即,如果ht(x)-l,则输入样本一皮分类为正的样本,而 如果ht(x)二O,则输入样本被分类为负的样本。4妾着ht(x)的伪损失可以 根据下式计算S是估计假设ht好坏程度的值。如果£'是零,则ht的结果很好。另 一方面,如果s'越大,则f'的结果越坏。应该注意到该误差是针对分布 AW来测量的。接着将^设置成等于^(1 —&),该值仅是为表达方便起见 的临时变量并且没有实质性的含意。根据下式来更新分布A".-<formula>complex formula see original document page 7</formula>其他 、乂其中z'是归一化常量(这样选择使得"'+1将是分布)。示例的权重与某个数相乘,使得可基于A来计算",+,。接着可通过除以归一化常量来 重新归一化权重。有效地,由许多先前弱假设所分类的"容本文档来自技高网...

【技术保护点】
一种用于将图像分类成多个种类的方法,包括步骤: 根据所述图像确定色彩直方图矢量;以及 基于所述色彩直方图矢量将所述图像分类成多个种类,其中所述色彩直方图矢量由从候选色彩直方图特征选择的一些色彩直方图特征组成。

【技术特征摘要】

【专利技术属性】
技术研发人员:王健民纪新
申请(专利权)人:佳能株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1