当前位置: 首页 > 专利查询>株式会社PFU专利>正文

图像处理装置以及文字识别方法制造方法及图纸

技术编号:9198501 阅读:168 留言:0更新日期:2013-09-26 02:39
本发明专利技术提供一种在确保文字识别的精度的同时,可以高速地进行文字识别的图像处理装置、文字识别方法、计算机程序。信息处理装置(20)具有:直方图生成部(203),其基于输入图像中的各像素的像素值来生成直方图;成分判定部(204),其基于直方图对输入图像中是否包含有文字成分、是否包含有非文字成分进行判定;二值化部(205),其在输入图像中包含有文字成分和非文字成分两者的情况下,通过基于各像素的边缘强度对输入图像进行二值化的第1处理来生成二值图像,在输入图像中包含有文字成分且不包含非文字成分的情况下,通过基于各像素的亮度值对输入图像进行二值化的第2处理来生成二值图像;文字识别部(206),其对二值图像进行文字识别。

【技术实现步骤摘要】
图像处理装置以及文字识别方法
本专利技术涉及一种图像处理装置以及文字识别方法,特别是涉及一种对多种原稿进行文字识别的图像处理装置以及文字识别方法。
技术介绍
作为对由扫描仪装置等读取原稿而获取的图像数据内的文字进行识别的技术,存在一种OCR(OpticalCharacterRecognition;光学文字识别)技术。在OCR技术中,现在寻求不仅是对只记载有文字的原稿,对文字、图片、照片等混在一起的原稿也能够识别文字。因此,为了能从各种原稿高精度地进行文字识别,OCR处理正变得复杂,处理需要较长时间。专利文献1中公开了一种包括CPU、串行运算处理部、并行运算处理部的信息处理装置。该信息处理装置中,对由CPU、串行运算处理部以及并行运算处理部中哪一个来执行包含于图像处理的各种运算处理能实现高速运行进行事先验证,并预先存储设定了由哪一个来执行各种运算处理的表格。并且,CPU针对已命令执行的各种运算处理,参照已存储的表格,确定哪一个为执行主体。专利文献2中公开了进行文字识别处理和压缩处理的图像处理装置。该图像处理装置针对文章、图形、图片混在一起的原稿,识别图像数据的属性(标题、文章、图形以及图片)并分割区域。并且,使用对包含标题、文章等的文字的区域进行简单二值化后得到的二值数据来进行文字识别处理。另外,专利文献2中记载了对针对包含标题、文章等的文字的区域进行简单二值化后得到的二值数据进行压缩处理,对针对图片、照片等的中间色调区域通过误差扩散法等进行二值化后得到的中间色调二值数据进行压缩处理。【现有技术文献】【专利文献】【专利文献1】特开2011-191903号公报【专利文献2】特开平8-315159号公报
技术实现思路
【专利技术要解决的技术问题】由于专利文献1中公开的信息处理装置对各被包含于图像处理的运算处理,选择能够最快执行该处理的处理部,因此能够高速地执行各运算处理。然而,由该信息处理装置进行文字识别处理的情况下,由于对所有原稿一律执行预先设定的运算处理,即使是对只记载有文字的原稿也需要与有文字、图片、照片等混在一起的原稿几乎相同的处理时间。由于专利文献2中公开的图像处理装置不对图片、照片等的区域进行文字识别处理,因而能够高速地执行文字识别处理。然而,该图像处理装置在图片、照片等的区域包含有文字的情况下,无法识别该文字。本专利技术的目的在于,提供一种在确保文字识别的精度的同时可以高速地进行文字识别的图像处理装置以及文字识别方法。【解决问题的技术手段】本专利技术的一方面所涉及的一种图像处理装置包括:直方图生成部,其基于输入图像中的各像素的像素值来生成直方图;成分判定部,其基于直方图对输入图像中是否包含有文字成分、是否包含有除文字成分和背景成分之外的非文字成分进行判定;二值化部,其在输入图像中包含有文字成分和非文字成分两者的情况下,通过基于各像素的边缘强度对该输入图像进行二值化的第1处理来生成二值图像,在输入图像中包含有文字成分且不包含非文字成分的情况下,通过基于各像素的亮度值对该输入图像进行二值化的第2处理来生成二值图像;文字识别部,其对二值图像进行文字识别。又,本专利技术的另一方面所涉及的一种文字识别方法包含:基于输入图像中的各像素的像素值来生成直方图的步骤;基于直方图对输入图像中是否包含有文字成分、是否包含有除文字成分和背景成分之外的非文字成分进行判定的步骤;在输入图像中包含有文字成分和非文字成分两者的情况下,通过基于各像素的边缘强度对该输入图像进行二值化的第1处理来生成二值图像,在输入图像中包含有文字成分且不包含非文字成分的情况下,通过基于各像素的亮度值对该输入图像进行二值化的第2处理来生成二值图像的步骤;对二值图像进行文字识别的步骤。【专利技术的效果】根据本专利技术的一个实施方式,能够提供一种在确保文字识别的精度的同时可以高速地进行文字识别的图像处理装置以及文字识别方法。附图说明图1是实施方式所涉及的图像处理系统的概略构成图。图2是图像处理部的概略构成图。图3是示出图像读取处理的动作的示例的流程图。图4是示出文字识别处理的动作的示例的流程图。图5是用于说明区域分割处理的示意图。图6是示出区域分割处理的动作的示例的流程图。图7(a)~(c)是用于说明成分判定处理的示意图。图8是示出成分判定处理的动作的示例的流程图。图9是示出二值化处理的动作的示例的流程图。图10是示出图像处理部的其它示例的概略构成图。图11是示出文字识别处理的动作的其它示例的流程图。图12是示出图像处理部的其它示例的概略构成图。图13是其它实施方式所涉及的图像处理系统的概略构成图。【符号的说明】1、2图像处理系统10、30图像读取装置11、31图像输入部12、32第1图像存储器部13、33第1接口部14、34第1存储部15、35第1中央处理部20、40信息处理装置21、41第2接口部22、42第2图像存储器部23、43显示部24、44输入部25、45第2存储部26、46第2中央处理部27、28、29、36图像处理部201图像转换部202区域分割部203直方图生成部204成分判定部205二值化部206文字识别部207布局分析部具体实施方式以下,针对本专利技术的一方面所涉及的图像处理装置以及文字识别方法参照图进行说明。但本专利技术的技术的范围并不限定于这些实施方式,值得注意的是其涉及到专利权利要求书所记载的专利技术及其等同专利技术。图1是示出实施方式所涉及的图像处理系统的概略构成的图。如图1所示,图像处理系统1具有图像读取装置10和信息处理装置20。图像读取装置10可以是例如图像扫描仪、数码相机等,信息处理装置20可以是例如与图像读取装置10相连接使用的个人电脑等。图像读取装置10具有图像输入部11、第1图像存储器部12、第1接口部13、第1存储部14、第1中央处理部15。以下,针对图像读取装置10的各部进行详细的说明。图像输入部11具有对作为摄像对象物的原稿等进行摄像的摄像传感器。该摄像传感器包括一维或二维排列的CCD(ChargeCoupledDevice:电荷耦合器件)、CMOS(ComplementaryMetalOxideSemiconductor:互补金属氧化物半导体)等的摄像元件和在摄像元件上对摄像对象物的像进行成像的光学系统,各摄像元件输出与RGB各个颜色相应的模拟值。然后,图像输入部11将摄像传感器输出的各模拟值转换成数字值后生成像素数据,并生成由已生成的各像素数据构成的图像数据(以下称为输入图像)。该输入图像中的各像素数据为,例如由RGB各个颜色分别用8bit来表示共计24bit的RGB值构成的彩色图像数据。第1图像存储器部12具有不挥发性半导体存储器、挥发性半导体存储器、磁盘等的存储装置。第1图像存储器部12与图像输入部11相连接,并保存由图像输入部11生成的输入图像。第1接口部13具有以USB(UniversalSerialBus:串行总线)等的串行总线为基准的接口电路,与信息处理装置20电连接并收发图像数据以及各种信息。又,也可将闪存等连接到第1接口部13以暂时性存储被保存到第1图像存储器部12的图像数据,并复制到信息处理装置20。又,也可以介由互联网、电话线路网(包含移动终端线路网、一般电话线路网)、企业内部网等的有线或无线网络来连接第1接口本文档来自技高网
...
图像处理装置以及文字识别方法

【技术保护点】
一种图像处理装置,其特征在于,包括:直方图生成部,其基于输入图像中的各像素的像素值来生成直方图;成分判定部,其基于所述直方图对所述输入图像中是否包含有文字成分、是否包含有除所述文字成分和背景成分之外的非文字成分进行判定;二值化部,其在所述输入图像中包含有所述文字成分和所述非文字成分两者的情况下,通过基于各像素的边缘强度对该输入图像进行二值化的第1处理来生成二值图像,在所述输入图像中包含有所述文字成分且不包含所述非文字成分的情况下,通过基于各像素的亮度值对该输入图像进行二值化的第2处理来生成二值图像;文字识别部,其对所述二值图像进行文字识别。

【技术特征摘要】
2012.03.19 JP 2012-0627311.一种图像处理装置,其特征在于,包括:直方图生成部,其基于输入图像中的各像素的像素值来生成直方图;成分判定部,其基于所述直方图对所述输入图像中是否包含有文字成分、是否包含有除所述文字成分和背景成分之外的非文字成分进行判定;二值化部,其在所述输入图像中包含有所述文字成分和所述非文字成分两者的情况下,通过基于各像素的边缘强度对该输入图像进行二值化的第1处理来生成二值图像,在所述输入图像中包含有所述文字成分且不包含所述非文字成分的情况下,通过基于各像素的亮度值对该输入图像进行二值化的第2处理来生成二值图像;文字识别部,其对所述二值图像进行文字识别。2.如权利要求1所述的图像处理装置,其特征在于,还包括:区域分割部,其将所述输入图像分割成各个以具有规定范围内的亮度值的像素相连通的区域为边界的图像区域,所述直方图生成部对各所述图像区域,分别生成所述直方图,所述成分判定部对各所述图像区域,判定是否包含有所述文字成分、是否包含有所述非文字成分,所述二值化部在所述输入图像中包含有所述文字成分和所述非文字成分两者的情况下,当所述图像区域的至少一个中包含有所述文字成分和所述非文字成分两者时,通过所述第1处理来生成二值图像,当所述图像区域的任一个都不包含所述...

【专利技术属性】
技术研发人员:岛崎克仁
申请(专利权)人:株式会社PFU
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1