图像识别方法以及摄像装置制造方法及图纸

技术编号:4130064 阅读:180 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种图像识别方法以及摄像装置,在使用由摄像装置拍摄的图像的块图像的特征量来识别对象时,抑制CPU的处理成本,高精度地识别对象。将图像数据分割为多个块而生成块图像,利用块图像的颜色空间信息以及频率分量来运算出各个块图像的特征量。另外,作为教师数据,预先运算出每个类型的图像特征量,并使用该特征量来计算出成为识别类型的边界的分离超平面,对于新获取的图像也同样地计算出块图像的图像特征量,利用从各类型的分离超平面起的距离,判定该块图像所属的类型。

【技术实现步骤摘要】

本专利技术涉及确定图像中的对象(类型,category)的技术,特别涉及在拍摄时高精度地进行风景等场景检测并能够进行适当的照相机设定的图像识别方法以及摄像装置
技术介绍
伴随数字照相机或带照相机的便携电话的普及,用户使用这样的设备在各种场景中进行拍摄的机会增加。在这样的场景之中,通过识别被摄体而设定正确的照相机参数,由此可以得到高质量的照片。在专利文献l中,公开出具有如下功能的图像处理装置除了从摄像图像中得到的信息以夕卜,还根据从照相机内的时钟、温度计、GPS图像中得到的信息等,推测摄像者在该条件下可能会最常用的拍摄模式并向摄像者提示。另外,在该文献中,还公开出识别被摄体,并+艮据其种类来推测拍摄场景的技术。专利文献1:日本特开2007 - 184733号z〉报但是,在专利文献l的图像处理装置中,为了得到用于推测拍摄模式的信息,需要传感器、GPS等硬件结构,所以难以安装到已有的照相机模块中。另外,难以摆脱数字照相机的小型化、向便携电话搭载时的物理或成本上的制约。'另一方面,作为一般的被摄体识别技术,有模板匹配、基于特征点提取的形状(轮廓)识别等方法。但是,在希望识别山、天空等人们识别为风景那样的被摄体(以下称为风景被摄体)的情况下,由于在这些风景被摄体中不存在特定的形状,所以不容易正确地识别。另外,在希望应对所有图案时,存在模板数据变得庞大这样的问题。
技术实现思路
本专利技术是鉴于上述情况而完成的,其目的在于提供一种图像识别方法,在不需要硬件等结构的情况下能够仅通过图像处理来判别拍摄场景,而且,在不使用庞大的模板数据的情况下能够高精度地识别风吝妯媼汰、, 、 , I w为了解决上述课题,本专利技术提供一种图像识别方法,通过计算机处理,根据输入的图像数据的块图像的特征量,将该块图像分类为预定的多个类型,其特征在于,包括块图像生成步骤,将上述图像数据分割为多个块而生成块图像;图像特征量运算步骤,利用块图像的颜色空间信息以及频率分量,运算出各个块图像的特征量;分离超平面运算步骤,读入针对每个块附有类型的教师数据图像,针对教师数据图像的块的每一个运算出图像特征量,学习成为识别各类型的边界的分离超平面;以及类型判定步骤,对于新获取的图像,执行块图像生成步骤和图像特征量运算步骤,计算出块图像的图像特征量,利用从各类型的分离超平面起的距离判定该块图像所属的类型。在本专利技术中,不只是使用块图像的颜色空间信息,而且还使用频率分量,将这些作为特征量,根据预先利用教师数据得到的从分离超平面起的距离来判定类型。将针对每个块附有类型的样本图像作为教师数据,运算出图像特征量空间中的每个类型的分离超平面,以该分离超平面数据为基准,针对每个块判别新获取的图像的类型。优选为,在图像特征量运算步骤中,将块图像在颜色空间上分割为多个等级并对每个等级的出现次数进行检测,并且运算出块内的像素间标准偏差,另一方面将该块图像进一步分为多个小块,计算出该小块的表示浓淡变化的频率分量,根据该频率分量,对于该小块所属的块内,针对水平方向与垂直方向中的至少一个方向,运算出频率分量的偏移,将出现次数、像素间标准偏差、频率分量以及频率分量的偏移作为图像特征量进行运算。5通过不只是使用块图像的颜色分量,而且还使用块内的频率分量的偏移,由此抑制了块分割数,从而能够高精度地进行识別。本专利技术的图像识别方法还包括匹配检查步骤,在该匹配检查步骤中,保存类型间的不匹配条件,在根据该不匹配条件与周围的块图像的类型变更了新获取的图像的块图像的类型之后,对邻接的同一类型的块进行分组,对于该分组后的块群,根据不匹配条件评价类型判定有无合理性。该不匹配条件由针对块图像单体的不匹配条件和针对块图像的组的不匹配条件构成。例如,在只有一个块的类型与周围邻接块的类型不同的情况下,使其与周围块的类型一致。此时,如果将从分离超平面起的距离加到该条件使得根据从分离超平面起的距离在正的距离大的情况下不变更时,可以实现更正确的修改。针对块群的不匹配条件例如是在天空之上不会出现海这样的判定位置关系的矛盾的条件。而且,该匹配检查步骤的结果,输出被评价为有合理性的块群的类型。由此,可以高精度地识别块群的类型。另外,如果使用上述图像特征量,则即使块分割数为一定,判定精度也高,但对于不同类型的边界的块,通过进一步分割为小块来判定类型,由此可以更精密地进行判定。另外,在图像处理中,通过在不同类型的块群的边界上检测边缘、边角,由此可以高效地进行图像处理。另外,本专利技术提供一种摄像装置,通过上述图像识别方法来识别图像的类型,其特征在于,具备拍摄条件保存单元,针对每个类型存储摄像装置的参数的设定条件和拍摄后的图像处理方法;摄像单元,在拍摄时,根据通过上述图像识别方法输出的拍摄对象图像的类型,设定摄像装置的参数并进行拍摄,获取摄像图像;以及图像处理单元,对该摄像图像通过针对该类型的图像处理方法执行图像处理。在本专利技术中,使用通过所谓预览得到的图像的类型判定的绪果,调整照相机参数(例如自动/手动模式、快门速度、曝光)等而进行拍摄,并在拍摄之后进而进行与该类型对应的图像处理(例如轮廓强调、色调校正等)。另外,通过使用图像的类型判定的结果,向用户提示最佳的拍摄模式,可以辅助用户选择拍摄模式。而且,本专利技术提供一种摄像装置,通过上述图像识别方法来识别图像的类型,其特征在于,具备程序储存单元,与类型对应关联地储存应执行的程序;程序选择单元,在程序储存单元中储存有与通过上述图像识别方法识别的类型对应关联的程序的情况下,选择该程序;以及程序执行单元,执行由程序选择单元选择的程序。在本专利技术中,自动地、或者基于在监视器画面上的显示输出之后的用户选择,启动与利用图像识别方法判定的类型对应的程序,由此可以实现操作的简化、高效化。根据本专利技术,将颜色空间信息和频率分量作为图像特征量,预先使用教师数据,根据每个类型的图像特征量计算出分离超平面,对于成为类型判定的对象的图像,利用该块的图像特征量的从各类型的分离超平面起的距离,判定该块的类型,所以即使是没有特征性的一定形状,且不适合模板匹配那样的风景被摄体,也可以高精度地识别对附图说明图1是实现本专利技术的实施方式的图像识别方法的判别器的概要说明图。图2是本专利技术的第一实施方式的判别器10的功能框图。图3是本专利技术的实施方式的频率分量处理的说明图。图4是使用了本专利技术的实施方式的柱状图的颜色分量处理的说明图。图5是示出本专利技术的实施方式的特征量空间与分离平面的关系的概要图。图6是特征量空间为二维时的分离超平面的概要图。图7是图2的图像特征量数据的结构例子。7图8是图2的分离超平面数据的结构例子。 图9是图2的结果文件的数据结构图。图IO是示出图2的匹配检查单元37的块单位的类型修改步骤的 流程图。图11是图10的处理中使用的修改阈值表的数据结构例子。图12是例示出图9的图像上的块组的位置关系的概要图。图13是示出图2的匹配检查单元37的块群匹配性判定步骤的流程图。图14是图13的处理中使用的不匹配条件表。 图15是本专利技术的第二实施方式的摄像装置的框图。 图16是图15的参数设定单元3具备的参数表的数据例子。 图17是图15的图像处理单元6具备的校正处理表的数据例子。 图18是示出摄像装置的液晶监视器上显示的被摄本文档来自技高网...

【技术保护点】
一种图像识别方法,通过计算机处理,根据输入的图像数据的块图像的特征量,将该块图像分类为预定的多个类型,其特征在于,包括: 块图像生成步骤,将上述图像数据分割为多个块而生成块图像; 图像特征量运算步骤,利用块图像的颜色空间信息以及 频率分量,运算出各个上述块图像的特征量; 分离超平面运算步骤,读入针对每个块附有类型的教师数据图像,针对上述教师数据图像的块的每一个运算出图像特征量,学习成为识别各类型的边界的分离超平面;以及 类型判定步骤,对于新获取的图像,执 行上述块图像生成步骤和上述图像特征量运算步骤,计算出块图像的图像特征量,利用特征量空间中的从各类型的分离超平面起的距离判定该块图像所属的类型。

【技术特征摘要】
JP 2008-8-13 2008-2084071.一种图像识别方法,通过计算机处理,根据输入的图像数据的块图像的特征量,将该块图像分类为预定的多个类型,其特征在于,包括块图像生成步骤,将上述图像数据分割为多个块而生成块图像;图像特征量运算步骤,利用块图像的颜色空间信息以及频率分量,运算出各个上述块图像的特征量;分离超平面运算步骤,读入针对每个块附有类型的教师数据图像,针对上述教师数据图像的块的每一个运算出图像特征量,学习成为识别各类型的边界的分离超平面;以及类型判定步骤,对于新获取的图像,执行上述块图像生成步骤和上述图像特征量运算步骤,计算出块图像的图像特征量,利用特征量空间中的从各类型的分离超平面起的距离判定该块图像所属的类型。2. 根据权利要求1所述的图像识别方法,其特征在于,在上述图像特征量运算步骤中,将上述块图像在颜色空间上分割为多个等级 并对每个等级的出现次数进行检测,并且运算出块内的像素间标准偏差,另一方面将该块图像进一步分为多个小块,计算出该小块的表示 浓淡变化的频率分量,根据该频率分量,对于该小块所属的块内,针 对水平方向与垂直方向中的至少一个方向,运算出上迷频率分量的偏移,将上述出现次数、上述# 素间标准偏差、上述频率分量以及上述 频率分量的偏移作为图像特征量...

【专利技术属性】
技术研发人员:安田泰代浜田哲也铃木敬平贺督基棚濑宁椎野寿树
申请(专利权)人:株式会社NTT都科摩株式会社摩如富
类型:发明
国别省市:JP[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1