OCR对象区域位置取得系统、文档实物、文档实物生成系统及存储介质技术方案

技术编号:35056397 阅读:18 留言:0更新日期:2022-09-28 11:03
本发明专利技术提供一种OCR对象区域位置取得系统、文档实物、文档实物生成系统及存储介质。OCR系统取得文档图像中的图像码的位置,取得由图像码表示的数据,基于所取得的文档图像中的图像码的位置、所取得的数据所包含的文档中的图像码的位置、以及所取得的数据所包含的文档中的手写输入栏的位置,取得文档图像中的手写输入栏的位置。写输入栏的位置。写输入栏的位置。

【技术实现步骤摘要】
OCR对象区域位置取得系统、文档实物、文档实物生成系统及存储介质


[0001]本专利技术涉及取得在作为文档的图像的文档图像中应当执行OCR(Optical Character Reognition,光学字符识别)处理的区域即OCR对象区域的文档图像中的位置的OCR对象区域位置取得系统、存储有OCR对象区域位置取得程序的计算机可读取的非暂时性存储介质、文档实物、文档实物生成系统以及存储有文档实物生成程序的计算机可读取的非暂时性存储介质。

技术介绍

[0002]以往,已知有一种对文档图像中的OCR对象区域执行OCR处理的技术。
[0003]当在从由纸等记录介质构成的文档的实物(以下称为“文档实物”)读取并生成OCR处理的对象的文档图像时发生了偏移的情况下,相对于从文档实物读取并生成OCR处理的对象的文档图像时未发生偏移的理想的文档图像,文档图像中的文档的位置发生偏移。在OCR处理的对象的文档图像相对于理想的文档图像文档的位置发生了偏移的情况下,OCR处理的对象的文档图像中的OCR对象区域也相对于理想的文档图像的OCR对象区域发生位置偏移。在现有技术中,在OCR处理的对象的文档图像中的OCR对象区域相对于理想的文档图像中的OCR对象区域位置发生了偏移的情况下,存在OCR处理的精度降低这样的问题。

技术实现思路

[0004]本专利技术的目的在于提供一种能够提高OCR处理的精度的OCR对象区域位置取得系统、存储有OCR对象区域位置取得程序的计算机可读取的非暂时性存储介质、文档实物、文档实物生成系统以及存储有文档实物生成程序的计算机可读取的非暂时性存储介质。
[0005]本专利技术提供一种OCR对象区域位置取得系统,其特征在于,包括:图像码位置取得部,取得文档图像中的图像码的位置,所述文档图像作为通过所述图像码赋予了数据的文档的图像;数据取得部,取得由所述图像码表示的数据;以及OCR对象区域位置取得部,取得OCR对象区域的所述文档图像中的位置,所述OCR对象区域作为所述文档图像中应当执行OCR处理的区域,通过所述图像码对所述文档赋予的数据包含:图像码位置数据,包含所述文档中的所述图像码的位置;以及OCR对象区域位置数据,包含所述文档中的所述OCR对象区域的位置,所述OCR对象区域位置取得部基于通过所述图像码位置取得部取得的所述文档图像中的所述图像码的位置;通过所述数据取得部取得的所述图像码位置数据所包含的所述文档中的所述图像码的位置;以及通过所述数据取得部取得的所述OCR对象区域位置数据所包含的所述文档中的所述OCR对象区域的位置,取得所述文档图像中的所述OCR对象区域的位置。
[0006]本专利技术提供一种存储介质,是存储有OCR对象区域位置取得程序的计算机可读取的非暂时性存储介质,其特征在于,所述OCR对象区域位置取得程序使计算机实现:图像码位置取得部,取得文档图像中的所述图像码的位置,所述文档图像作为通过图像码赋予了
数据的文档的图像;数据取得部,取得由所述图像码表示的数据;以及OCR对象区域位置取得部,取得OCR对象区域的所述文档图像中的位置,所述OCR对象区域作为所述文档图像中应当执行OCR处理的区域,通过所述图像码对所述文档赋予的数据包含:图像码位置数据,包含所述文档中的所述图像码的位置;以及OCR对象区域位置数据,包含所述文档中的所述OCR对象区域的位置,所述OCR对象区域位置取得部根据通过所述图像码位置取得部取得的所述文档图像中的所述图像码的位置、通过所述数据取得部取得的所述图像码位置数据所包含的所述文档中的所述图像码的位置、以及通过所述数据取得部取得的所述OCR对象区域位置数据所包含的所述文档中的所述OCR对象区域的位置,取得所述文档图像中的所述OCR对象区域的位置。
[0007]本专利技术提供一种文档实物,其特征在于,作为通过图像码赋予了数据的文档的实物,通过所述图像码对所述文档赋予的数据包含:图像码位置数据,包含所述文档中的所述图像码的位置;以及OCR对象区域位置数据,包含OCR对象区域在所述文档中的位置,所述OCR对象区域作为所述文档的图像中应当执行OCR处理的区域。
[0008]本专利技术提供一种文档实物生成系统,其特征在于,包括生成文档实物的文档实物生成部,所述文档实物作为通过图像码赋予了数据的文档的实物,通过所述图像码对所述文档赋予的数据包含:图像码位置数据,包含所述文档中的所述图像码的位置;以及OCR对象区域位置数据,包含OCR对象区域在所述文档中的位置,所述OCR对象区域作为所述文档的图像中应当执行OCR处理的区域。
[0009]本专利技术提供一种存储介质,是存储有文档实物生成程序的计算机可读取的非暂时性存储介质,其特征在于,所述文档实物生成程序使计算机实现生成文档实物的文档实物生成部,所述文档实物作为通过图像码赋予了数据的文档的实物,通过所述图像码对所述文档赋予的数据包含:图像码位置数据,包含所述文档中的所述图像码的位置;以及OCR对象区域位置数据,包含OCR对象区域在所述文档中的位置,所述OCR对象区域作为所述文档的图像中应当执行OCR处理的区域。
[0010]本专利技术的OCR对象区域位置取得系统、存储有OCR对象区域位置取得程序的计算机可读取的非暂时性存储介质、文档实物、文档实物生成系统以及存储有文档实物生成程序的计算机可读取的非暂时性存储介质能够提高OCR处理的精度。
附图说明
[0011]图1是本专利技术的一个实施方式所涉及的系统的框图。
[0012]图2是由1台计算机构成的情况下的图1所示的OCR系统的框图。
[0013]图3是图1所示的MFP的框图。
[0014]图4是图1所示的利用者终端的框图。
[0015]图5是使MFP印刷文档的情况下的图2所示的OCR系统的动作的流程图。
[0016]图6是表示在图5所示的动作中制作的文档的一例的图。
[0017]图7是表示赋予了图像码的图6所示的文档的一例的图。
[0018]图8是表示由图7所示的图像码表示的数据的一例的图。
[0019]图9是从文档图像提取信息的情况下的图2所示的OCR系统的动作的流程图。
[0020]图10A是表示图9所示的动作的对象的文档实物中的手写输入栏以及图像码的一
例的图。图10B是表示从图10A所示的文档实物读取到的文档图像中的手写输入栏以及图像码的一例的图。
具体实施方式
[0021]以下,参照附图对本专利技术的实施方式进行说明。
[0022]首先,对本专利技术的一个实施方式所涉及的系统的构成进行说明。
[0023]图1是本实施方式的系统10的框图。
[0024]如图1所示,系统10具备:OCR(Optical Character Recognition,光学字符识别)系统20,从文档图像中提取信息;MFP(Multifunction Peripheral,多功能外围设备)30,作为从由纸等记录介质构成的文档实物读取文档图像的图像读取装置;以及利用者终端40,由利用者利本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种OCR对象区域位置取得系统,其特征在于,包括:图像码位置取得部,取得文档图像中的图像码的位置,所述文档图像作为通过所述图像码赋予了数据的文档的图像;数据取得部,取得由所述图像码表示的数据;以及OCR对象区域位置取得部,取得OCR对象区域的所述文档图像中的位置,所述OCR对象区域作为所述文档图像中应当执行OCR处理的区域,通过所述图像码对所述文档赋予的数据包含:图像码位置数据,包含所述文档中的所述图像码的位置;以及OCR对象区域位置数据,包含所述文档中的所述OCR对象区域的位置,所述OCR对象区域位置取得部基于通过所述图像码位置取得部取得的所述文档图像中的所述图像码的位置;通过所述数据取得部取得的所述图像码位置数据所包含的所述文档中的所述图像码的位置;以及通过所述数据取得部取得的所述OCR对象区域位置数据所包含的所述文档中的所述OCR对象区域的位置,取得所述文档图像中的所述OCR对象区域的位置。2.一种存储介质,是存储有OCR对象区域位置取得程序的计算机可读取的非暂时性存储介质,其特征在于,所述OCR对象区域位置取得程序使计算机实现:图像码位置取得部,取得文档图像中的图像码的位置,所述文档图像作为通过所述图像码赋予了数据的文档的图像;数据取得部,取得由所述图像码表示的数据;以及OCR对象区域位置取得部,取得OCR对象区域的所述文档图像中的位置,所述OCR对象区域作为所述文档图像中应当执行OCR处理的区域,通过所述图像码对所述文档赋予的数据包含:图像码位置数据,包含所述文档中的所述图像码的位置;以及OCR对象区域位置数据,包含所述文档中的所述OCR对象区域的位置,所述OCR对象区域位置取得部基于通过所...

【专利技术属性】
技术研发人员:佐佐木秀行
申请(专利权)人:京瓷办公信息系统株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1