图像处理装置以及文字识别方法制造方法及图纸

技术编号：9198501 阅读：168 留言：0更新日期：2013-09-26 02:39

本发明专利技术提供一种在确保文字识别的精度的同时，可以高速地进行文字识别的图像处理装置、文字识别方法、计算机程序。信息处理装置（20）具有：直方图生成部（203），其基于输入图像中的各像素的像素值来生成直方图；成分判定部（204），其基于直方图对输入图像中是否包含有文字成分、是否包含有非文字成分进行判定；二值化部（205），其在输入图像中包含有文字成分和非文字成分两者的情况下，通过基于各像素的边缘强度对输入图像进行二值化的第1处理来生成二值图像，在输入图像中包含有文字成分且不包含非文字成分的情况下，通过基于各像素的亮度值对输入图像进行二值化的第2处理来生成二值图像；文字识别部（206），其对二值图像进行文字识别。

全部详细技术资料下载

【技术实现步骤摘要】
图像处理装置以及文字识别方法
本专利技术涉及一种图像处理装置以及文字识别方法，特别是涉及一种对多种原稿进行文字识别的图像处理装置以及文字识别方法。
技术介绍
作为对由扫描仪装置等读取原稿而获取的图像数据内的文字进行识别的技术，存在一种OCR（OpticalCharacterRecognition；光学文字识别）技术。在OCR技术中，现在寻求不仅是对只记载有文字的原稿，对文字、图片、照片等混在一起的原稿也能够识别文字。因此，为了能从各种原稿高精度地进行文字识别，OCR处理正变得复杂，处理需要较长时间。专利文献1中公开了一种包括CPU、串行运算处理部、并行运算处理部的信息处理装置。该信息处理装置中，对由CPU、串行运算处理部以及并行运算处理部中哪一个来执行包含于图像处理的各种运算处理能实现高速运行进行事先验证，并预先存储设定了由哪一个来执行各种运算处理的表格。并且，CPU针对已命令执行的各种运算处理，参照已存储的表格，确定哪一个为执行主体。专利文献2中公开了进行文字识别处理和压缩处理的图像处理装置。该图像处理装置针对文章、图形、图片混在一起的原稿，识别图像数据的属性（标题、文章、图形以及图片）并分割区域。并且，使用对包含标题、文章等的文字的区域进行简单二值化后得到的二值数据来进行文字识别处理。另外，专利文献2中记载了对针对包含标题、文章等的文字的区域进行简单二值化后得到的二值数据进行压缩处理，对针对图片、照片等的中间色调区域通过误差扩散法等进行二值化后得到的中间色调二值数据进行压缩处理。【现有技术文献】【专利文献】【专利文献1】特开2011-191903号公报...
图像处理装置以及文字识别方法

【技术保护点】
一种图像处理装置，其特征在于，包括：直方图生成部，其基于输入图像中的各像素的像素值来生成直方图；成分判定部，其基于所述直方图对所述输入图像中是否包含有文字成分、是否包含有除所述文字成分和背景成分之外的非文字成分进行判定；二值化部，其在所述输入图像中包含有所述文字成分和所述非文字成分两者的情况下，通过基于各像素的边缘强度对该输入图像进行二值化的第1处理来生成二值图像，在所述输入图像中包含有所述文字成分且不包含所述非文字成分的情况下，通过基于各像素的亮度值对该输入图像进行二值化的第2处理来生成二值图像；文字识别部，其对所述二值图像进行文字识别。

【技术特征摘要】
2012.03.19 JP 2012-0627311.一种图像处理装置，其特征在于，包括：直方图生成部，其基于输入图像中的各像素的像素值来生成直方图；成分判定部，其基于所述直方图对所述输入图像中是否包含有文字成分、是否包含有除所述文字成分和背景成分之外的非文字成分进行判定；二值化部，其在所述输入图像中包含有所述文字成分和所述非文字成分两者的情况下，通过基于各像素的边缘强度对该输入图像进行二值化的第1处理来生成二值图像，在所述输入图像中包含有所述文字成分且不包含所述非文字成分的情况下，通过基于各像素的亮度值对该输入图像进行二值化的第2处理来生成二值图像；文字识别部，其对所述二值图像进行文字识别。2.如权利要求1所述的图像处理装置，其特征在于，还包括：区域分割部，其将所述输入图像分割成各个以具有规定范围内的亮度值的像素相连通的区域为边界的图像区域，所述直方图生成部对各所述图像区域，分别生成所述直方图，所述成分判定部对各所述图像区域，判定是否包含有所述文字成分、是否包含有所述非文字成分，所述二值化部在所述输入图像中包含有所述文字成分和所述非文字成分两者的情况下，当所述图像区域的至少一个中包含有所述文字成分和所述非文字成分两者时，通过所述第1处理来生成二值图像，当所述图像区域的任一个都不包含所述...

【专利技术属性】
技术研发人员：岛崎克仁，
申请(专利权)人：株式会社PFU，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人