图像识别方法、图像识别装置和记录介质制造方法及图纸

技术编号:36610658 阅读:15 留言:0更新日期:2023-02-08 09:58
本发明专利技术提供图像识别方法、图像识别装置和存储有图像识别程序的计算机可读非临时性记录介质,特征量提取部根据输入图像生成由多个基本特征图构成的基本特征图群,并对基本特征图群中的基本特征图实施多种统计量计算,生成多个统计量图。推断器对基于所述多个统计量图的推断输入导出分割的推断结果。而且,上述的多种统计量计算分别是以特定的窗口尺寸特定的计算式计算统计量的处理,所述窗口尺寸和计算式中的至少一方,在所述多种统计量计算之间彼此不同。彼此不同。彼此不同。

【技术实现步骤摘要】
图像识别方法、图像识别装置和记录介质


[0001]本专利技术涉及图像识别方法、图像识别装置和存储有图像识别程序的计算机可读非临时性记录介质。

技术介绍

[0002]近年,利用机器学习得到的推断器(分类器等)已被实用化。
[0003]通常,在这种推断器中,为了得到足够精度的推断结果需要大量训练数据,而在训练数据相对较少的情况下,有时因训练数据的偏差得不到良好的推断结果。
[0004]为了抑制这种训练数据的偏差的影响,会使用集成学习。在集成学习中,使用彼此独立性较高的多个推断器,并通过多数投票法等从所述多个推断器的推断结果可以得到一个最终的推断结果。
[0005]另一方面,在图像识别领域中,某个图像处理装置针对成为图像识别的对象的输入图像,应用提取多个尺寸和多个方向的特定形状(线等)的空间滤波器,检测输入图像中包含的朝向某个方向的某个尺寸的特定形状。
[0006]此外,某个检查装置进行:(a)使用机器学习模型,导出输入图像中是否包含异常的判定结果,(b)计算包含异常的图像与输入图像的相关度以及不包含异常的图像与输入图像的相关度,根据所述相关度对上述的判定结果的可靠性进行评价。
[0007]考虑针对图像识别用的多个推断器(分类器等)的集成学习,根据表示以如上所述的方式检测出的特定形状的特征量进行各推断器的机器学习,但是作为用于图像识别用的多个推断器的训练数据,难以准备集成学习所需的用于输出独立性高且足够精度的推断结果的特征量。
[0008]此外,在检测出异常后由人进行异常的确认的情况等中,需要预先确定输入图像中的异常的位置。这种情况下,可以通过分割来确定输入图像中的异常的位置。可是,为了进行良好的分割,需要对异常的位置(区域)进行学习,所以充分地准备分割用的训练数据更为困难。

技术实现思路

[0009]鉴于上述的问题,本专利技术的目的是得到图像识别方法、图像识别装置和存储有图像识别程序的计算机可读非临时性记录介质,能够不使用机器学习或者在使用机器学习的情况下也以相对较少的训练数据量进行分割。
[0010]本专利技术的图像识别方法,包括:特征量提取步骤,根据输入图像生成由多个基本特征图构成的基本特征图群,并对所述基本特征图群中的基本特征图实施多种统计量计算,生成多个统计量图;以及推断步骤,对基于所述多个统计量图的推断输入,用推断器导出分割的推断结果。而且所述多种统计量计算分别是以特定的窗口尺寸特定的计算式计算统计量的处理,所述窗口尺寸和所述计算式中的至少一方,在所述多种统计量计算之间彼此不同。
[0011]本专利技术的图像识别装置,包括:特征量提取部,根据输入图像生成由多个基本特征图构成的基本特征图群,并对所述基本特征图群中的基本特征图实施多种统计量计算,生成多个统计量图;以及推断器,对基于所述多个统计量图的推断输入,用推断器导出分割的推断结果。而且所述多种统计量计算分别是以特定的窗口尺寸特定的计算式计算统计量的处理,所述窗口尺寸和所述计算式中的至少一方,在所述多种统计量计算之间彼此不同。
[0012]本专利技术的计算机可读非临时性记录介质,存储有图像识别程序,计算机通过执行所述图像识别程序发挥下述功能:特征量提取部,根据输入图像生成由多个基本特征图构成的基本特征图群,并对所述基本特征图群中的基本特征图实施多种统计量计算,生成多个统计量图;以及推断器,对基于所述多个统计量图的推断输入,用推断器导出分割的推断结果。而且所述多种统计量计算分别是以特定的窗口尺寸特定的计算式计算统计量的处理,所述窗口尺寸和所述计算式中的至少一方,在所述多种统计量计算之间彼此不同。
[0013]按照本专利技术,可以得到图像识别方法、图像识别装置和存储有图像识别程序的计算机可读非临时性记录介质,能够不使用机器学习或者在使用机器学习的情况下也以相对较少的训练数据量进行分割。
[0014]本专利技术的上述或其他目的、特征和优点会根据以下的详细说明和附图变得更加明确。
附图说明
[0015]图1是表示本专利技术的实施方式1的图像识别装置的构成的框图。
[0016]图2是表示图1中的特征量提取部11的构成的框图。
[0017]图3是说明图2所示的特征量提取部11的动作的一例的图。
[0018]图4是说明图3中的统计量图导出部23的动作的图。
[0019]图5是说明图1中的推断输入生成部12的动作的一例的图。
[0020]图6是说明实施方式2的图像识别装置中的聚类的图。
具体实施方式
[0021]以下,根据附图对本专利技术的实施方式进行说明。
[0022]实施方式1.
[0023]图1是表示本专利技术的实施方式1的图像识别装置的构成的框图。图1所示的图像识别装置是数码复合机、扫描仪等电子设备、个人计算机等终端装置、网络上的服务器等,通过用内置的计算机执行图像识别程序,使所述计算机作为后述的处理部发挥功能。
[0024]图1所示的图像识别装置具备特征量提取部11、推断输入生成部12、多个推断器13-1~13-N(N>1)、综合器14、权重设定器15和机器学习处理部16。
[0025]特征量提取部11根据输入图像生成由多个基本特征图构成的基本特征图群,并对所述基本特征图群中的基本特征图实施多种统计量计算,生成多个统计量图。
[0026]输入图像是由未图示的扫描仪读取的图像、基于由未图示的通信装置接收的图像数据的图像、基于存储于未图示的存储装置的图像数据的图像等,是成为图像识别的对象的图像。
[0027]此外,从输入图像通过多个特定处理(这里,空间滤波处理)分别提取出上述的多
个基本特征图。例如,生成数十至数百个基本特征图,作为一个基本特征图群。
[0028]而且,统计量图表示各像素位置的统计量计算(平均,分散等)的计算结果的值。
[0029]图2是表示图1中的特征量提取部11的构成的框图。图3是说明图2所示的特征量提取部11的动作的一例的图。
[0030]如图2所示,特征量提取部11具备滤波部21、滤波输出综合部22、统计量图导出部23。滤波部21以规定特性的多个空间滤波器对输入图像执行滤波处理,滤波输出综合部22根据输入图像的各位置中的由滤波部21进行的多个滤波处理结果,生成基本特征图。
[0031]例如图3所示,为了检测特定形状(直线和曲线等线、点、圆、多边形等),分别对多个尺寸使用检测灵敏度根据方向而不同的多个空间滤波器,生成包含多个空间滤波器的滤波输出的逻辑和的形状的基本特征图。例如仅在某个空间滤波器的滤波输出中显示线形状、在其他全部空间滤波器的滤波输出中不显示形状的情况下,生成包含所述线形状的基本特征图。此外,例如在多个空间滤波器的滤波输出中显示线形状的情况下,生成包含所述线形状交差的位置的点(即,成为线形状的逻辑积的点形状)的基本特征图。
[0032]所述空间滤波器例如使用2维Gabor滤波器。这种情况下,使用与检测对象的尺寸对应的空间频率所匹配的滤波特性的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于包括:特征量提取步骤,根据输入图像生成由多个基本特征图构成的基本特征图群,并对所述基本特征图群中的基本特征图实施多种统计量计算,生成多个统计量图;以及推断步骤,对基于所述多个统计量图的推断输入,用推断器导出分割的推断结果,所述多种统计量计算分别是以特定的窗口尺寸特定的计算式计算统计量的处理,所述窗口尺寸和所述计算式中的至少一方,在所述多种统计量计算之间彼此不同。2.根据权利要求1所述的图像识别方法,其特征在于,所述基本特征图具有表示多个特定形状的位置、尺寸和方向的2维数据,所述多个推断输入是以所述尺寸分类的一个或多个统计量图。3.根据权利要求1所述的图像识别方法,其特征在于,所述推断器是机器学习完毕的推断器。4.根据权利要求1所述的图像识别方法,其特征在于,所述推断器不使用机器学习而通过聚类生成推断结果。5.根据权利要求1所述的图像识别方法,其特征在于,还具备综合步骤,在所述推断步骤中,对基于所述多个统计量图的多个推断输入,分别使用多个推断器导出多个推断结果,在所述综合步骤中,将所述多个推断结果以规定的方法进行综合,导出最终推断结果。6.根据权利要求5所述的图像识别方法,其特征在于,所述多个推断输入分别具有所述多个统计量图的一部分或全部的统计量图,所述多个推断输入中的各推断输入具有的统计量图与所述多个推断输入中的其他推断输...

【专利技术属性】
技术研发人员:宫本卓哉森本加奈子滨边留以兼古志郎东山尚道
申请(专利权)人:京瓷办公信息系统株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1