图像分类方法及图像分类装置制造方法及图纸

技术编号：3898596 阅读：307 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种图像分类方法及图像分类装置，其中该图像分类方法包括以下步骤：图像分割步骤，将输入的图像分割为多个区域；特征提取步骤，提取每个区域的视觉特征；第一分类步骤，对于每个区域，根据所提取的所述区域的视觉特征，利用第一分类器，按照预定的多个类别对所述区域进行多类分类；上下文关系特征生成步骤，根据每个区域的分类结果来生成所述图像的上下文关系特征；以及第二分类步骤，根据所生成的所述图像的上下文关系特征，利用第二分类器，确定所述图像所属的类别。根据上述技术方案，可以有效地利用图像的上下文关系信息来提高图像分类性能，而无需显式定义图像中对象之间的空间关系。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术一般地涉及模式识别和多媒体
，特别涉及一种图像分类方法及图像分类装置。
技术介绍
随着多媒体技术的发展和因特网的普及，人们获得各种多媒体信息越来越容易，其中图像是数量最多的一种，如何对图像进行分类或标注以便有效地、快速地从大规模图像数据库中检索出所需要的图像已成为人们日益关注的问题。一种传统的做法是通过关键字对图像进行人工标注。然而，该方法是极其费时的，并且不同的人可能产生不同的标注结果，例如，包含菊花的图像可能被标注为“菊花”或“黄色花”。为了克服人工标注的限制，例如，在T. Kato所著的“Databasearchitecture for content-based image retrieval，，(Image Storage and RetrievalSystems, Proc. SPIE, 1662:112-123,1992) 一文中公开了一种基于内容的图像检索技术(CBIR)，其中提取图像的诸如颜色，纹理，形状等低层视觉特征来推断图像的高层语义。然而，由于图像的低层视觉特征与图像的语义表达之间存在“语义鸿沟”，因此传统的CBIR技术不能满足人们按语义对图像进行分类和检索的需求。对于图像语义信息的提取，上下文关系信息是重要的。具体地说，以对象“老虎”的概念为例，其通常都出现在具有诸如“天空”、“草地”等背景对象的自然风景中。这样，为了改善图像分类和检索性能，一种趋势是在从图像中提取语义概念时既考虑图像的内容信息也考虑其上下文关系信息。例如，在J.Luo等人所著的“Pictures are not taken...

【技术保护点】
一种图像分类方法，包括以下步骤：图像分割步骤，将输入的图像分割为多个区域；特征提取步骤，提取每个区域的视觉特征；第一分类步骤，对于每个区域，根据所提取的所述区域的视觉特征，利用第一分类器，按照预定的多个类别对所述区域进行多类分类；上下文关系特征生成步骤，根据每个区域的分类结果来生成所述图像的上下文关系特征；以及第二分类步骤，根据所生成的所述图像的上下文关系特征，利用第二分类器，确定所述图像所属的类别。

【技术特征摘要】

【专利技术属性】
技术研发人员：吴伟国，路红，薛向阳，
申请(专利权)人：索尼株式会社，复旦大学，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人