图像处理装置及图像处理方法制造方法及图纸

技术编号:2925388 阅读:121 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种图像处理程序及图像处理装置,从包含色偏差或颜色模糊的文档图像中,高精度地抽取记入文字、印迹、标记等。本发明专利技术的图像处理方法构成:从彩色图像或亮度图像中除去背景部分,生成表示背景以外的部分的背景除去数据的背景除去数据生成部;在彩色图像或亮度图像的上述背景以外部分中,生成将背景以外部分的轮廓的颜色转换成在背景以外部分的轮廓的内侧中的像素的颜色的数据的轮廓颜色转换数据生成部;和抽取特定对象部分的特定对象抽取部。

【技术实现步骤摘要】

本专利技术涉及一种利用光学文字读取装置(OCR: Optical Character Reader)、扫描仪、数字照相机等拍摄例如帐票等文档, 从生成的文档图像中抽取记入文字、印迹、标记等特定对象的图像处 理方法及图像处理装置。
技术介绍
在金融机关或自治团体中,使用OCR等扫描仪装置,实现帐票 等文档处理业务的高效化。OCR的主要功能是文档图像的生成、文 档图像中文字的抽取、文字识别。作为生成的文档图像的种类,有二 值图像、亮度图像、彩色图像。使用二值图像的处理,由于数据量小,因此处理时间变少。但是, 在二值图像处理中,在帐票中预先印刷的称为预印(Pr印rint)的格 线、位线、提示文字、阴影和手写或后来印刷的记入文字有很大重叠 的情况下,难以区分它们。因此,存在文字的抽取结果中产生噪声的 情况、或抽取的文字的一部分欠缺的情况,有文字识别出错的问题。使用亮度图像的处理是黑白的浓淡图像处理。由于在亮度图像处 理中,利用预印和记入文字的亮度值不同来区别它们,因此在预印和 记入文字重叠的情况下,区分它们比二值图像处理变得容易。但预印 和记入文字的亮度值相近的情况下,它们的判别精度变低。在利用彩色图像的处理中,由于能根据预印和记入文字的颜色的 不同而区别,因此区别它们比亮度图像处理变得容易。在彩色图像处 理中,通过去除预印的颜色来抽取记入文字、印迹、标记等。该方法中,有像专利文献3那样去除在帐票输入前指定的去 除颜色的方法,和像专利文献1或专利文献2那样抽取在输入的帐票内的像格线那样的特定的形状部分,去除与该抽取部分的颜 色相同颜色的方法。专利文献1特开2003 - 19659专利文献2特开2005 - 25868专利文献3特开2006 - 13435专利文献4特开2004 - 33610专利文献5特开2005 - 18810在上述彩色图像处理中,存在由于由OCR、扫描仪、数字照相 机生成的图像中产生色偏差,不能正确地抽取记入文字或印迹等特定 对象,而留有一部分预印,或特定对象的一部分欠缺等问题。所谓色偏差是指感测到的3原色的颜色分量,成为红色分量的R 值、成为绿色分量的G值及成为蓝色分量的B值中至少一个值的位 置偏移。作为色偏差产生的主要原因,列举镜头的色差、传感器的配 置位置、搬运速度等。特别是在利用台式扫描仪或数字照相机等的二 维CCD的扫描仪中,产生较多因色差而带来的色偏差。由于色偏差,在预印或记入文字等的特定对象的轮廓部分中,产 生与特定对象的本来的颜色不同的伪色。例如,有在黑色文字的轮廓 中,产生红色和蓝色的伪色的情况,或在蓝色的格线的轮廓上产生浅 红色的伪色的情况等。因此,在根据颜色的信息区别记入文字和预印 等的彩色图像处理中产生错误。对此,专利文献4尝试除去镜头的色差专利文献5尝 试除去由传感器的配置位置而产生的色偏差。然而,即使进行计侧并补正偏差量的方法,从图像中完全除去色 偏差是困难的。此外,更高精度的色偏差补正要花费很多的格线时间 的问题也出现了。此外,在上述彩色图像处理或亮度图像处理中,在图像中产生颜 色模糊的情况下,存在不能正确地抽取记入文字或印迹等特定对象, 留有一部分预印,或文字的一部分欠缺的问题。所谓颜色模糊,是指格线或记入文字的轮廓部分的颜色模糊,产生浅色。由于颜色模糊而使预印或记入文字的红色分量、蓝色分量、 绿色分量、明度、彩度、色相、亮度等颜色信息的分散变大,因此区 别记入文字和预印变得困难。
技术实现思路
本专利技术鉴于这些问题而完成,提供一种从含有色偏差或颜色模糊 的文档图像中,高精度地抽取记入文字、印迹、标记等特定对象的图 像处理方法及图像处理装置。为达到上述目的,本专利技术在从利用扫描仪或数字照相机读取帐票 等文档的彩色图像或亮度图像中,抽取记入文字、印迹、标记等特定对象的图像处理方法中,具备以下特征,具有从彩色图像或亮度图 像中除去背景,生成显示背景以外的部分的背景除去数据的背景除去 生成处理;生成在彩色图像或亮度图像中的上述背景以外部分中、将 背景以外部分的轮廓的颜色信息转换为在背景以外部分的轮廓内侧 的图像的颜色信息的数据的轮廓颜色转换数据生成处理;和抽取特定 对象部分的特定对象抽取处理。此外,上述轮廓颜色转换数据生成处理的特征在于,对于彩色图 像或亮度原图像内的关注像素,参照作为在其附近的多个像素的附近 像素,生成将关注像素的红色分量、蓝色分量、绿色分量、明度、彩 度、色相、亮度等颜色信息转换为在附近像素和关注像素中亮度值最 低的像素的颜色信息的低亮度颜色膨胀亮度数据。上述特定对象判别处理的特征在于,进行格线抽取、特定对象候 补抽取、格线的颜色信息和特定对象的颜色信息的推定和特定对象的判别。根据本专利技术,即使是有色偏差或颜色模糊的彩色图像或亮度图 像,也能高精度地区别预印、记入文字、印迹、标记等特定对象,例 如能高精度地仅抽取记入文字。不仅限于记入文字,也能高精度地抽 取印迹或标记等在文档图像内的特定对象。附图说明图l是表示特定对象抽取处理的结构的图。图2是表示图像处理装置的图。图3是彩色图像的例子。图4是背景除去数据。图5是特定对象的判别结果。图6是表示背景除去数据生成处理的例子的图。图7是表示以往的特定对象判别处理的图。图8是格线抽取结果。图9是格线除去结果。图IO是特定对象候补抽取结果。图ll是记入文字的色偏差的例子。图12是格线的色偏差的例子。图13是表示轮廓颜色转换数据生成处理的例子的图。 图14是表示图11的图像的轮廓颜色转换数据生成处理的图。 图15是表示图12的图像的轮廓颜色转换数据生成处理的图。 图16是表示特定对象判别处理的图。图17是表示仅利用格线颜色的推定的特定对象判别处理的图。 图18是表示仅利用特定对象颜色的推定的特定对象判别处理的图。图19是表示利用聚类的特定对象判别处理的图。图20是表示添加色偏差补正的特定对象抽取处理程序的结构的图。图21是表示具备抽取对象颜色指定功能的特定对象抽取处理程 序的结构的图。图22是表示包含指定抽取对象颜色的从属特定对象判别处理程 序的图。图23是表示利用包含指定抽取对象颜色的聚类的特定对象判别 处理的图。图24是表示颜色模糊的例子的图。图25是表示对于有颜色模糊的图像的轮廓颜色转换数据生成处 理的情况的图。图26是表示亮度图像输入的轮廓颜色转换数据生成处理的例子的图。图27是彩色图像的显示例。 图28是特定对象的判别结果的显示例。 (符号说明) 101图像取得模块 102背景除去数据生成模块 103轮廓颜色转换数据生成模块 104特定对象判别模块 105控制模块具体实施例方式以下,对于应用本专利技术的图像处理方法及图像处理装置,利用附 图详细说明。 实施例1图2是表示本专利技术的图像处理装置的一实施方式的图。 这是将通信装置201、图《象取得装置202、显示装置203、外部 存储装置204、存储器205、 CPU (Central Processing Unit) 206、键 盘或鼠标等输入装置207利用PCI总线等通信线连接的图像处理装置 208。图1所示的具备特定对象抽取处理的结构的程序容纳在外部存 储装置204或存储器205等的存储装置中,利用CPU205执行。输入到CPU中的文档的彩色图像或亮本文档来自技高网
...

【技术保护点】
一种图像处理装置,其特征在于,具备:从输入的图像信息除去背景,生成表示背景以外的区域的背景除去数据的单元;生成颜色转换数据的单元,该颜色转换数据是在输入的图像信息的背景以外的区域中,将与特定对象有关的轮廓的像素的颜色信息转换为在上述轮廓的内侧的像素的颜色信息的颜色转换数据;存储上述背景除去数据及上述颜色转换数据的单元;和从上述背景除去数据选择特定对象候补,参照上述颜色转换数据,输出特定对象部分的特定对象判别单元。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:关峰伸浅野英辅永吉洋登永崎健新庄广
申请(专利权)人:日立欧姆龙金融系统有限公司
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利