文档图像处理装置、文档图像处理方法、及存储计算机程序的命令的可计算机读出的存储介质制造方法及图纸

技术编号:6623454 阅读:191 留言:0更新日期:2012-04-11 18:40
本实施方式提供一种文档图像处理装置,具备:取出部,其从输入文档图像的像素取出第一文档要素,从对应所述输入文档图像的预印数据的像素取出第二文档要素;推定部,其推定所述第一文档要素各色空间的第一代表色和第二文档要素各色空间的第二代表色;算出部,其算出在所述色空间上分离各所述第一代表色的第一分离平面和在所述空间上分离各所述第二代表色的第二分离平面;置换部,其将分布于通过所述第一分离平面分离的所述色空间的分离区域的所述第一文档要素的各第一像素的色置换为分布于同所述分离区域的所述第一代表色,将分布于通过第二分离平面分离的所述色空间的分离区域的所述第二文档要素的各第二像素的色置换为分布于同所述分离区域的所述第二代表色;生成部,其生成置换的各第一像素和置换的各第二像素的差分图像。

【技术实现步骤摘要】

本专利技术所说明的实施方式(多数形式)全部涉及文档图像处理装置、文档图像处理方法、及存储计算机程序的命令的可计算机读出的存储介质
技术介绍
利用扫描仪等将帐票等文档变换为数字数据时,由于使数据量减少等目的而多作为黑白图像或灰色标度图像保存。但是,近年由于彩色打印等的普及而彩色文档变多,随之,将其作为彩色图像进行保存的必要性增多。彩色图像因为相比黑白图像或灰度标准图像数据量庞大,所以,通常实施一些压缩处理进行保存。作为一般的彩色图像的压缩方法,有JPEG(Jojnt Photgraphic Experts Group) 方式的压缩。但是,已知,若增大包含文字等的文档图像的压缩率,则由于方框噪声而文字的边缘部分产生模糊,可视性降低。作为其对策,首先可以列举将图像进行减色化进行压缩的技术。当用扫描仪读取文档时,由于量子化误差或读取时的位置偏差,其色数成为庞大的数。在文档图像中,为了进行有效的压缩处理,有效的是通过减少其色数的减色处理实现数据量的削减。该减色处理例如对色空间的频率分布进行Hough变换或主成分分析决定色数。同时,求上述色空间的色的直线状的分布,使用将其分布进行分类得到的数据族的数色进行减色化。另外,也可以列举在准备了预先记入栏等的帐票中只取出用手写等补记的图像的技术。用扫描仪读取帐票,在通过通信装置向远地发送该帐票图像数据的情况下,若将读取数据全部发送,则成为庞大的数据量浪费成本。通常,在帐票中,在将予设定的项目进行字或印刷的用纸中,多为人通过手写等向項目栏记入内容。但是,事前已知已经进行了印字或印刷的图像数据(以下,称为预印数据),用手写等补记的数据为重要的数据。从而,若从用扫描仪读取的图像只取出用手写等补记的数据的图像,将取出的图像数据向远地发送,则效率高。而且,在接收侧合成接收的图像数据和预准备的预印数据,从而可以复原显示和发送侧相同的图像数据。但是,文字的边缘部分的图像,特别是由于扫描时的彩色边纹等多为与实际使用的墨水色分离。例如,受墨水色和底色的双方的影响成为中间色。该情况下,因为与直线分布分离的色的处理不明,所以不能对应。另外,帐票等的文档图像中,存在通过设置为网点(網点)而意图将特定的栏设为中间色的情况。而且,也存在在其网点(半色调点)上用和网点相同色的墨水印刷文字的情况。该情况下,若进行文档图像的色的置换处理,则文字和网点作为相同的色被识别,存在难以读出文字的问题。另外,用同系色对文字、格线、其它图像进行印字的帐票的读取图像数据难以分类。例如,在读取对红色的文字、格线进行印字,然后添加印章的盖章的红色的文档的图像的情况下,难以将红色的文字、格线和红色作为不同的颜色进行分类。
技术实现思路
本专利技术实施方式的文档图像处理装置具备取出部,其从输入文档图像的像素取出第一文档要素,从对应所述输入文档图像的预印数据的像素取出第二文档要素;推定部, 其推定所述第一文档要素各色空间的第一代表色和第二文档要素各色空间的第二代表色; 算出部,其算出在所述色空间上分离各所述第一代表色的第一分离平面和在所述空间上分离各所述第二代表色的第二分离平面;置换部,其将分布于通过所述第一分离平面分离的所述色空间的分离区域的所述第一文档要素的各第一像素的色置换为分布于同所述分离区域的所述第一代表色,将分布于通过第二分离平面分离的所述色空间的分离区域的所述第二文档要素的各第二像素的色置换为分布于同所述分离区域的所述第二代表色;生成部,其生成置换的各第一像素和置换的各第二像素的差分图像。本专利技术其它实施方式的文档图像处理装置,具备取出部,其从输入文档图像取出文档要素;推定部,其推定取出的所述文档要素的色空间的代表色;算出部,其算出在所述色空间上分别分离所述代表色的分离平面;置换部,其将分布于通过所述分离平面分离的所述色空间的分离区域的所述文档要素的各像素的色置换为分布于同所述分离区域的所述代表色;生成部,其生成将各像素的色置换为所述代表色的所述输入文档图像的各像素和对应已经实施了所述代表色的置换的所述输入文档图像的预印数据的各像素的差分图像。本专利技术其它实施方式的文档图像处理方法,具备从输入文档图像的像素取出第一文档要素,从对应所述输入文档图像的预印数据的像素取出第二文档要素的步骤;推定所述第一文档要素各色空间的第一代表色和第二文档要素各色空间的第二代表色的步骤; 算出在所述色空间上分离各所述第一代表色的第一分离平面和在所述空间上分离各所述第二代表色的第二分离平面的步骤;将分布于通过所述第一分离平面分离的所述色空间的分离区域的所述第一文档要素的各第一像素的色置换为分布于同所述分离区域的所述第一代表色,将分布于通过第二分离平面分离的所述色空间的分离区域的所述第二文档要素的各第二像素的色置换为分布于同所述分离区域的所述第二代表色的步骤;生成置换的各第一像素和置换的各第二像素的差分图像的步骤。本专利技术其它实施方式的文档图像处理方法,具备输入输入文档图像的步骤;从所述输入文档图像的各像素取出文档要素的步骤;推定取出的所述文档要素的色空间的代表色的步骤;算出在所述色空间上分离所述代表色的分离平面的步骤;将分布于通过所述分离平面分离的所述色空间的分离区域的所述文档要素的各像素的色置换为分布于同所述分离区域的所述代表色的步骤;生成将各像素的色置换为所述代表色的所述输入文档图像的各像素和对应已实施了所述代表色的置换的所述输入文档图像的预印数据的各像素的差分图像的步骤。本专利技术其它实施方式的存储介质,其存储对输入文档图像进行减色处理的程序。 所述程序使计算机实施如下功能,即从输入文档图像的像素取出第一文档要素,从对应所述输入文档图像的预印数据的像素取出第二文档要素的功能;推定各所述第一文档要素的色空间的第一代表色和各所述第二文档要素的色空间的第二代表色的功能;算出在所述色空间上分离各所述第一代表色的第一分离平面、在所述色空间上分离各所述第二代表色的第二分离平面的功能;将分布于通过所述第一分离平面分离的所述色空间的分离区域的所述第一文档要素的各第一像素的色置换为分布于同所述分离区域的所述第一代表色,将分布于通过第二分离平面分离的所述色空间的分离区域的所述第二文档要素的各第二像素的色置换为分布于同所述分离区域的所述第二代表色的功能;生成置换的各第一像素和置换的各第二像素的差分图像的功能。本专利技术其它实施方式的存储介质,其存储减色处理输入文档图像的程序。所述程序使计算机实施以下功能,即从输入文档图像的各像素取出文档要素的功能;推定取出的所述文档要素的色空间的代表色的功能;算出在所述色空间上分离所述代表色的分离平面的功能;将分布于通过所述分离平面分离的所述色空间的分离区域的所述文档要素的各像素的色置换为分布于同所述分离区域的所述代表色的功能;生成将所述各像素的色置换为所述代表色的所述输入文档图像的各像素和对应已经实施所述代表色的置换的所述输入文档图像的预印数据的各像素的差分图像的功能。本公开的实施方式通过读以下的详细说明及参照附图可以明白。这些详细的说明及附图用于说明本专利技术实施方式而提供,并不限定于本专利技术范围。附图说明图1是表示本专利技术一实施方式的文档图像处理装置的构成的图;图2是表示图1所示的第一实施方式的CPU的功能构成的图;图3是表示图2本文档来自技高网
...

【技术保护点】
1.一种文档图像处理装置,其特征在于,具备:取出部,其从输入文档图像的像素取出第一文档要素,从对应所述输入文档图像的预印数据的像素取出第二文档要素;推定部,其推定所述第一文档要素各色空间的第一代表色和第二文档要素各色空间的第二代表色;算出部,其算出在所述色空间上分离各所述第一代表色的第一分离平面和在所述空间上分离各所述第二代表色的第二分离平面;置换部,其将分布于通过所述第一分离平面分离的所述色空间的分离区域的所述第一文档要素的各第一像素的色置换为同样分布于所述分离区域的所述第一代表色,将分布于通过第二分离平面分离的所述色空间的分离区域的所述第二文档要素的各第二像素的色置换为同样分布于所述分离区域的所述第二代表色;生成部,其生成置换的各第一像素和置换的各第二像素的差分图像。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:小平直朗
申请(专利权)人:株式会社东芝东芝解决方案株式会社
类型:发明
国别省市:JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1