图像识别装置以及图像识别方法制造方法及图纸

技术编号:8022883 阅读:146 留言:0更新日期:2012-11-29 05:04
本发明专利技术提供图像识别装置以及图像识别方法。在按照预先设定的类别利用已预先学习完毕的分离平面将分割对象图像而获得的块图像分类为类别的图像识别装置中,具备:输入部,其输入对象图像;块图像生成部,其将对象图像分割为多个块而生成多个块图像;特征量计算部,其计算块图像的特征量;以及类别判别部,其采用与特征量空间中的块图像的特征量的大小对应的坐标位置以及分离平面,判别块图像是否被分类为类别,特征量计算部采用根据该块图像的图像信息算出的局部特征量以及根据对象图像整体的图像信息算出的全局特征量,作为块图像的特征量。

【技术实现步骤摘要】

本专利技术的各个方面以及实施方式涉及。
技术介绍
以往,作为图像识别装置,公知有如下这样的装置将作为识别对象的对象图像分割为块状而生成块图像并将块图像分类为预先设定的多个类别(例如,参照专利文献I)。专利文献I所述的装置采用训练图像在将图像特征作为坐标轴的特征量空间中按照每个类别来学习分离平面,并根据分离平面以及与块图像的特征量的大小对应的坐标位置,将块图像分类为类别。块图像的特征量是该块图像的图像信息(颜色空间信息以及频率分量)O专利文献2日本特开2010-45613号公报 但是,在专利文献I所述的图像识别装置中,有时难以将块图像分类为合适的类另IJ。例如,在块图像是蓝色一种颜色的情况下,难以判断该块的类别为“天空”还是“水池”。
技术实现思路
在本
中,期望一种能够提高分割对象图像而获得的块图像的分类精度的。S卩,本专利技术一个方面的图像识别装置的特征在于,该图像识别装置在以图像的特征为坐标轴的特征量空间中,预先学习为了将所述图像分类为预先设定的类别而采用的分离平面,并利用所述分离平面将分割对象图像而获得的块图像分类为所述类别,该图像识别装置的特征在于,具备输入部,其输入所述对象图像;块图像生成部,其将所述对象图像分割为多个块而生成多个所述块图像;特征量计算部,其计算所述块图像的特征量;以及类别判别部,其采用所述特征量空间中的与所述块图像的特征量的大小对应的坐标位置以及所述分离平面,判别所述块图像是否被分类为所述类别,所述特征量计算部采用根据所述块图像的图像信息算出的局部特征量以及根据所述对象图像整体的图像信息算出的全局特征量,作为该块图像的特征量。根据本专利技术一个方面的图像识别装置,作为块图像的特征量,不仅采用根据该块图像的图像信息算出的局部特征量,还采用根据对象图像整体的图像信息算出的全局特征量,所以不仅能利用块图像其本身的信息还可以考虑块图像与对象图像之间的关系而对块图像进行分类。因此,在仅利用块图像无法判断类别的情况下,有时只要观察对象图像整体就能够判断块图像的类别。所以,能够提高块图像的分类精度。这里,上述特征量计算部可采用根据四边形状的上述对象图像中的四角区域的图像信息算出的特征量作为上述全局特征量。通过这样的结构,可包含在将圆形物作为被摄体时出现的特征作为块图像的特征量。另外,作为上述块图像的特征量,上述特征量计算部可采用根据包围该块图像周围的上述块图像即周边块图像的图像信息算出的邻近特征量。通过这样的结构,可考虑块图像与在其周围存在的块图像之间的关系来对该块图像进行分类。另外,上述特征量计算部可采用根据从上述周边块图像中选择出的上述块图像的图像信息算出的特征量作为上述邻近特征量。通过这样的结构,可在块图像的特征量中包含周边块图像的对称性,所以可进一步考虑块图像与其周围的块图像之间的关系而进行分类。另外,上述特征量计算部也可以选择上述块图像的上述周边块图像中的处于以该块图像为中心对称的位置处的上述周边块图像。通过这样的结构,不仅能够分别单独地算出周边块的特征量,还能够算出针对具有对称性的块的组的特征量,所以可对在左右/上下方向等上具有形状对称性的被摄体和背景进行分类。另外,作为上述块图像的特征量,上述特征量计算部可采用根据由多个上述块图像构成的部分区域中的包含该块图像的上述部分区域的图像信息算出的半全局特征量。通过这样的结构,可考虑块图像与在其周围存在的块图像之间的关系来对该块图像进行分 类。此外,上述特征量计算部采用根据由包含该块图像的横长区域的上述块图像构成的上述部分区域的图像信息算出的特征量以及根据由包含该块图像的纵长区域的上述块图像构成的上述部分区域的图像信息算出的特征量作为上述半全局特征量。通过这样的结构,可适当识别在水平方向/垂直方向上具有特征的被摄体/背景等而对块图像进行分类。另外,本专利技术另一个方面的图像识别方法,其特征在于,在以图像的特征为坐标轴的特征量空间中,预先学习为了将所述图像分类为预先设定的类别而采用的分离平面,并利用所述分离平面将分割对象图像而获得的块图像分类为所述类别,该图像识别方法的特征在于,具备以下步骤输入步骤,输入所述对象图像;块图像生成步骤,将所述对象图像分割为多个块而生成多个所述块图像;特征量计算步骤,计算所述块图像的特征量;以及类别判别步骤,采用所述特征量空间中的与所述块图像的特征量的大小对应的坐标位置以及所述分离平面,判别所述块图像是否被分类为所述类别,在所述特征量计算步骤中,采用根据所述块图像的图像信息算出的局部特征量以及根据所述对象图像整体的图像信息算出的全局特征量,作为该块图像的特征量。根据上述图像识别方法,可起到与上述本专利技术的图像识别装置同样的效果。以上,根据本专利技术的各个方面以及实施方式,能够提高分割对象图像而获得的块图像的分类精度。附图说明图I是安装了实施例的图像识别装置的便携终端的功能框图。图2是安装了图I中的图像识别装置的便携终端的硬件结构图。图3是说明对象图像的块单位的图像识别的概要图。㈧是对象图像,⑶是块分割后的对象图像,(C)是按照块单位被分类的对象图像。图4是块单位的图像特征量的一例。图5是说明局部特征量的概要图。图6是亮度值以及色差值的直方图的一例。㈧是Y分量的直方图,⑶是U分量的直方图,(C)是V分量的直方图。图7是说明邻近特征量的概要图。图8是说明半全局特征量的概要图。(A)是在纵方向以及横方向上扩展的区域,(B)是示出在纵方向上延伸的区域和在横方向上延伸的区域的概要图。图9是说明全局特征量的概要图。(A)是示出全部区域的概要图,(B)是示出四角区域的概要图。图10是说明边缘尺寸的特征量的概要图。图11是学习分离超平面的装置的功能框图。图12(A)是训练数据的一例。(B)是说明块单位的学习的概要图。图13是用于说明分离超平面的概要图。 图14是示出图I中的图像识别装置的动作的流程图。标号说明I...图像识别装置,2...学习装置,10...对象图像输入部(输入部),11...块图像生成部,12...特征量计算部,13...类别判别部。具体实施例方式以下,参照附图来说明本专利技术的实施方式。此外,对附图说明中相同的元素标注同一标号并省略重复的说明。另外,附图的尺寸比率未必与说明中的比率一致。本实施方式的图像识别装置是将对象图像分割为固定尺寸的块图像并以块为单位来识别被摄体的装置,例如,安装于移动电话、数字照相机、PDA (Personal DigitalAssistant :个人数字助理)或通用计算机系统等中的装置。此外,下面考虑到便于理解,将安装在便携终端中的图像识别装置作为本专利技术的图像识别装置的一例进行说明。图I是具备本实施方式的图像识别装置I的便携终端3的功能框图。图I所示的便携终端3是例如由用户携带的移动终端,其具有图2所示的硬件结构。图2是便携终端3的硬件结构图。如图2所示,便携终端3物理上构成为包含CPU (Central ProcessingUnit :中央处理器)100、ROM (Read Only Memory :只读存储器)101 以及 RAM (Random AccessMemory :随机存取存储器)102等主存储装置、照相机或键盘等输入设备103、显示器等输出设备104、硬盘等辅助存储装本文档来自技高网...

【技术保护点】
一种图像识别装置,该图像识别装置在以图像的特征为坐标轴的特征量空间中,预先学习为了将所述图像分类为预先设定的类别而采用的分离平面,并利用所述分离平面将分割对象图像而获得的块图像分类为所述类别,该图像识别装置的特征在于,具备:输入部,其输入所述对象图像;块图像生成部,其将所述对象图像分割为多个块而生成多个所述块图像;特征量计算部,其计算所述块图像的特征量;以及类别判别部,其采用所述特征量空间中的与所述块图像的特征量的大小对应的坐标位置以及所述分离平面,判别所述块图像是否被分类为所述类别,所述特征量计算部采用根据所述块图像的图像信息算出的局部特征量以及根据所述对象图像整体的图像信息算出的全局特征量,作为该块图像的特征量。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:棚瀬宁三浦健等等力康弘椎野寿树羽深兼介
申请(专利权)人:株式会社摩如富
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1