当前位置: 首页 > 专利查询>北京大学专利>正文

一种基于多层次内容描述的图像分类方法技术

技术编号:4075256 阅读:243 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种基于多层次内容描述的图像分类方法,包括以下步骤:1)给定训练图像集,通过多层次图像分割得到每幅图像区域层次结构树,提取图像区域层次结构树中每个节点区域的底层特征;2)通过训练图像集区域的底层特征集合构建视觉词汇表,根据视觉词汇表将图像区域层次结构树映射到中层图像特征,得到训练图像集的多层次内容描述;3)基于训练图像集的多层次内容描述建立图像分类模型,根据图像分类模型实现待分类图像分类。该方法采用了图像多层次的分割区域:一方面,增强了对图像内容描述的完备性;另一方面,增强了对图像过分割和欠分割的鲁棒性。因此,能够得到更有效的图像描述,从而取得更高的图像分类准确率。

【技术实现步骤摘要】

本专利技术涉及图像的模式分类领域,具体涉及一种基于多层次内容描述的图像分类 方法。
技术介绍
随着数字照相机等电子设备的普及、图像编码技术的进步,视觉内容每天以数以 百万件计的速度被创造出来。随着互联网的发展、计算机数据处理能力的提高,网络上的各 类资源也随之日益丰富。人们面临的问题不再是缺少多媒体内容,而是如何在大量的多媒 体资源中找到自己所需要的信息。在缺乏文本标注的情况下,基于内容的图像分类能够为 图像内容提供语义线索,可以促进高效的图像检索和处理,具有十分重要的研究应用价值。作为分类器模型的基础,图像内容描述方法直接影响图像分类效果。总的来说,图 像内容分为全局信息和局部信息两种。例如,1998年1月IEEE International Workshop onContent-Based Access of Image and Video Database 中,M. Szummer 禾口 R. W. Picard 的 文章“Indoor-outdoor image classification”采用了图像全局特征颜色直方图来区别 “室内”和“室外”两种不同类别的图像;2007年7月IEEE Conference on Computer Vision and PatternRecognition 中,D. G6kalp禾口 S. Aksoy 的文章"Scene classification using bag-of-regionsr印resentation”采用了图像分块区域特征来进行场景分类。图像的全局 信息和局部信息都为图像分类提供了有价值的线索。现有方法中,基于区域提取图像局部 信息的方法依赖于单一层次图像分割。通过单一层次图像分割,图像被分割成多个互不重 叠的子区域。然而,图像包含了从整体到局部多层次的内容,基于单一层次图像分割区域难 以描述图像多层次的内容。此外,由于统一的分割终止条件难以适应不同的待分割图像,常 常出现过分割和欠分割的情况,而过分割和欠分割都会降低基于单一层次图像分割区域方 法的图像内容描述能力。如何有效的描述图像多层次的内容成为基于内容的图像分类方法的一个难题。
技术实现思路
本专利技术要解决的技术问题是提供一种图像分类方法,该方法基于图像多层次内容 进行图像分类,能够提高图像分类准确率。为了解决上述技术问题,本专利技术提供一种图像分类方法,包括以下步骤—种基于多层次内容描述的图像分类方法,包括以下步骤1)给定训练图像集,通过多层次图像分割得到每幅图像区域层次结构树,提取图 像区域层次结构树中每个节点区域的底层特征;2)通过训练图像集区域的底层特征集合构建视觉词汇表,根据视觉词汇表将图像 区域层次结构树映射到中层图像特征,得到训练图像的多层次内容描述;3)基于训练图像集的多层次内容描述建立图像分类模型,根据图像分类模型实现 待分类图像分类。所述步骤1)采用迭代的聚类方法进行多层次图像分割,具体为首先,根据整幅图像像素的颜色和位置信息用聚类的方法将其分割成两个子区 域;然后,进一步将得到的子区域用相同的方式分割;如此迭代,直到分割终止条件满足。所述分割终止条件为当分割区域面积小于设定阈值时,该区域不足以表达一个 完整的语义单位,分割终止,所述设定阈值为图像总面积的二十分之一。所述步骤1)采用区域的颜色、纹理和形状特征作为节点区域的底层特征。所述步骤2)采用随机采样策略构建视觉词汇表,从训练集区域特征集合中随机 选择一定数量的特征作为视觉词汇,所述视觉词汇表完成构建后保持不变。所述步骤2)根据图像区域底层特征与所述视觉词汇表中的词汇间的相似性将图 像区域层次结构树映射到中层图像特征。所述步骤3)采用一对多的方式建立图像分类模型,即对于每一个图像类别,都采 用该类别的图像作为正样本,其余图像类别的图像作为负样本,训练一个分类器,所述图像 分类模型由不同类别的分类器共同构成。所述步骤3)对于每一幅待分类图像,首先通过多层次图像分割得到每幅图像区 域层次结构树,提取图像区域层次结构树中每个节点区域的底层特征;然后根据视觉词汇 表将图像区域层次结构树映射到中层图像特征,得到待分类图像的多层次内容描述;最后 根据图像分类模型分别计算该图像属于各个类别的概率,并采用预测概率最大值对应的图 像类别作为该图像的类别。本专利技术的效果在于与现有方法相比,本专利技术能够取得更高的图像分类准确率,从 而有效地促进了基于内容的图像检索和处理。本专利技术之所以具有上述专利技术效果,其原因在于采用了图像多层次的分割区域。一 方面,通过描述图像多层次的内容,增强了对图像内容描述的完备性;另一方面,尽管过分 割时,一个物体会被过度分割成多个部分,但物体这个整体对应的区域依然保留在多层次 的分割区域中,基于多层次分割区域的图像内容描述方法对过分割有较强的适应性,同时, 我们又可以通过调节分割终止条件,减少欠分割的情况,因此,本专利技术增强了对图像过分割 和欠分割的鲁棒性。综上所述,本专利技术能够得到更有效的图像描述,从而取得更高的图像分 类准确率。附图说明图1为本专利技术基于多层次内容描述的图像分类方法的流程图。图2为多层次图像分割示意图。图3为单一层次图像分割示意图。图4为基于多层次内容描述的图像分类与基于单一层次内容描述的图像分类效 果对比图。具体实施例方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图,对根据本专利技术一个实施例的图像分类方法进一步详细说明。本实施方式中,首先提取图像的多层次内容描述,然后通过分类器模型实现图像 分类。包括以下步骤步骤1,通过多层次图像分割得到图像区域层次结构树,提取图像区域层次结构树 中每个节点区域的底层特征。这一步骤可以在训练图片集和待分类图片集中同时进行。多层次图像分割采用迭代的聚类方法进行。首先,根据整幅图像像素的颜色和位 置信息用聚类的方法将其分割成两个子区域;然后,进一步将得到的子区域用相同的方式 分割;如此迭代,直到分割终止条件满足。本实施例中,采用归一化分割的方法进行聚类,该 方法不仅强调类内的相似性,而且强调类间的差异性,能够取得更好的聚类效果。假定当分 割区域面积小于一定阈值时,该区域不足以表达一个完整的语义单位,分割终止。本实施例 中,设定面积阈值为图像总面积的二十分之一。附图2展示了一个多层次图像分割示例,从 示例中可以看出,一幅图像被分割成一棵图像区域层次结构树。其中,原始图片是包括了蓝 天、白云、大海、沙滩、绿地、红花的一幅图片,经过第一次分割分为了蓝天、白云、大海部分 和沙滩、绿地、红花部分;第二次分割将蓝天、白云、大海分割为蓝天、白云部分和大海部分, 进一步对蓝天白云部分进行分割为蓝天部分和白云部分;沙滩、绿地、红花部分也是如此进 行分割,第二次分割成绿地、红花部分和沙滩部分,进一步将绿地红花部分分割成绿地部分 和红花部分,最终形成树状结构。节点区域的底层特征通过区域的颜色、纹理和形状特征表示。本实施例中,颜色特 征采用了 HSV颜色空间上81维(9HX3SX3V)颜色直方图;纹理特征采用了 59维的局部二进制模式形状特征采用了前3阶的归一化惯性(Normalized Inertia)。颜色特征、纹理特征、形状特征通过拼接构成统一的底层特征,并将每一维本文档来自技高网
...

【技术保护点】
一种基于多层次内容描述的图像分类方法,包括以下步骤:1)给定训练图像集,通过多层次图像分割得到每幅图像区域层次结构树,提取图像区域层次结构树中每个节点区域的底层特征;2)通过训练图像集区域的底层特征集合构建视觉词汇表,根据视觉词汇表将图像区域层次结构树映射到中层图像特征,得到训练图像集的多层次内容描述;3)基于训练图像集的多层次内容描述建立图像分类模型,根据图像分类模型实现待分类图像分类。

【技术特征摘要】

【专利技术属性】
技术研发人员:李浩彭宇新
申请(专利权)人:北京大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利