对扫描图像进行预定处理的设备、其控制方法和存储介质技术

技术编号:20518151 阅读:24 留言:0更新日期:2019-03-06 02:45
一种对扫描图像进行预定处理的设备、其控制方法和存储介质。通过使用扫描图像的字符识别结果,用户可以通过简单操作来为该扫描图像设置诸如文件名等的补充信息。所述设备包括:显示控制单元,用于显示进行预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及设置单元,用于对用户经由UI画面所选择的字符区域进行OCR处理,并且通过使用在OCR处理中所提取的字符串来设置预定处理的补充信息,其中,在用户选择多个字符区域的情况下,设置单元基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。

Equipment, control method and storage medium for pre-processing scanned images

The invention relates to a device for pre-processing scanned images, a control method thereof and a storage medium. By using the character recognition result of the scanned image, the user can set additional information such as file name for the scanned image through simple operation. The device includes a display control unit for displaying a UI screen used for preset processing, which displays the character area of the scanned image in a manner that the user can select, and a setting unit for OCR processing of the character area selected by the user via the UI screen, and for setting the preset processing by using the string extracted in the OCR processing. In the case that the user selects multiple character regions, the setting unit determines whether a separator should be inserted between extracted strings based on the position relationship between the selected character regions, and inserts a separator between extracted strings when it is determined that a separator should be inserted.

【技术实现步骤摘要】
对扫描图像进行预定处理的设备、其控制方法和存储介质
本专利技术涉及使用扫描图像的字符识别结果并且为该扫描图像设置文件名等的技术。
技术介绍
传统上,通过扫描来数字化纸质文档的方法已被广泛用作文档管理方法。此外,在数字化文档时,存在对所扫描的图像数据进行光学字符识别处理(OCR处理)并且将所识别的字符用于数字化后的文档文件的文件名的技术。例如,日本特开2008-176624公开了如下的技术:针对所扫描的图像数据预先设置进行OCR处理的多个区域,然后根据表示预先设置的文件名的格式的规则和各区域的字符识别结果来设置文件名。日本特开2008-176624还公开了:在设置表示文件名的格式的规则时,可以在多个区域的字符识别结果之间添加诸如连字符等的特定符号(分隔符)。然而,在日本特开2008-176624所公开的方法中,需要针对各种文档设置OCR处理的对象区域和表示文件名的格式的规则。因此,为了向各种类型的文档适当地添加文件名,需要根据文档的类型来预先设置规则,这需要大量的时间和精力来完成该工作。另外,在日本特开2008-176624所公开的方法中,由于要在各区域的字符识别结果之间插入的分隔符遵循预先设置的规则,因此根据实际的扫描图像不能灵活地判断在添加文件名时是否插入分隔符。将参考附图给出具体示例。图1示出为报价单(quotation)的扫描图像设置文件名的情形。现在,假定对一个连续的字符串的每个区域(字符区域)进行OCR处理,并且设置在字符区域之间插入“_(下划线)”作为分隔符的规则。在图1所示的示例中,由于在“QUOTATION”的各字符(字母)之间存在空格,因此尽管“QUOTATION”不应分开这一事实,但将“QUOTATION”划分成各自包括一个字符的字符区域。结果,设置了文件名“Q_U_O_T_A_T_I_O_N”。在这种情况下,期望不应在字符识别结果之间插入分隔符,但日本特开2008-176624的技术不能应对这种情况。本专利技术是为了解决上述问题而做出的,并且本专利技术的目的是使用扫描图像的字符识别结果,并且使得用户能够通过简单操作来为扫描图像设置文件名等。
技术实现思路
根据本专利技术,提供一种用于对通过扫描文档所获得的扫描图像进行预定处理的设备,所述设备包括:显示控制单元,用于显示进行所述预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及设置单元,用于对用户经由所述UI画面所选择的字符区域进行OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述预定处理所用的补充信息,其中,在用户选择多个字符区域的情况下,所述设置单元基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。一种用于对通过扫描文档所获得的扫描图像进行预定处理的设备的控制方法,所述控制方法包括以下步骤:利用显示控制单元,显示进行所述预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及利用设置单元,对用户经由所述UI画面所选择的字符区域进行OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述预定处理所用的补充信息,其中,在进行设置的步骤中,在用户选择多个字符区域的情况下,基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。一种非暂时性计算机可读存储介质,其存储程序,所述程序用于使计算机进行用于对通过扫描文档所获得的扫描图像进行预定处理的设备的控制方法,所述控制方法包括以下步骤:利用显示控制单元,显示进行所述预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及利用设置单元,对用户经由所述UI画面所选择的字符区域进行OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述预定处理所用的补充信息,其中,在进行设置的步骤中,在用户选择多个字符区域的情况下,基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。通过以下参考附图对典型实施例的说明,本专利技术的其它特征将变得明显。附图说明图1是示出现有技术的问题的图;图2是示出图像处理系统的整体结构的图;图3A是示出MFP的硬件结构的图;图3B是示出文件服务器的硬件结构的图;图4是示出MFP的软件结构的图;图5是示出从扫描图像的生成起直到上传为止的操作控制的流程的流程图;图6示出扫描设置画面的示例;图7A和图7B示出预览画面的示例;图8示出在预览画面上生成文件名的状态;图9示出上传画面的示例;图10是示出根据第一实施例的文件名生成处理的详情的流程图;图11是示出根据第二实施例的文件名生成处理的详情的流程图;以及图12是示出用于在连续的字符区域中自动选择字符串的处理的详情的流程图。具体实施例以下参考附图来根据优选实施例详细说明本专利技术。在以下实施例中示出的结构仅是示例性的,并且本专利技术不限于示意性示出的结构。第一实施例图像处理系统的结构图2是示出根据本实施例的图像处理系统的整体结构的图。图像处理系统包括MFP110和文件服务器120,其中MFP110和文件服务器120经由LAN(局域网)彼此连接以进行通信。MFP(多功能打印机)110是具有诸如扫描器和打印机等的多个功能的多功能设备,并且是图像处理设备的示例。文件服务器120是用于存储并管理数字化的文档文件的外部服务器的示例。本实施例的图像处理系统包括MFP110和文件服务器120,但不限于此。例如,MFP110也可以用作文件服务器120。此外,可以采用代替LAN而是经由例如因特网的连接形式。此外,MFP110连接至PSTN(公共交换电话网络),并且可以通过传真向传真机(未示出)发送图像数据并从传真机(未示出)接收图像数据。图3A是MFP110的硬件结构的图。MFP110包括控制单元210、操作单元220、打印机单元221、扫描器单元222和调制解调器223。控制单元210包括以下的单元211~219以控制MFP110的整体操作。CPU211加载ROM212中所存储的控制程序,并且执行并控制MFP110的诸如扫描、打印和通信等的各种功能。RAM213用作CPU211的主存储器或者诸如工作区等的临时存储区域。应当注意,在本实施例中,一个CPU211使用一个存储器(RAM213或HDD214)来进行如后面将说明的流程图所示的各处理,但本专利技术不限于此。例如,多个CPU可以通过与多个RAM或HDD一起工作来进行处理。HDD214是用于存储图像数据和各种程序的大容量存储单元。操作单元I/F215是连接操作单元220和控制单元210的接口。操作单元220具有触摸面板和键盘等,并且接收用户的操作、输入和指示。打印机I/F216是连接打印机单元221和控制单元210的接口。将打印所用的图像数据从控制单元210经由打印机I/F216传送至打印机单元221并打印在打印介质上。扫描器I/F217是连接扫描器单元222和控制单元210的接口。扫描器单元222扫本文档来自技高网
...

【技术保护点】
1.一种用于对通过扫描文档所获得的扫描图像进行预定处理的设备,所述设备包括:显示控制单元,用于显示进行所述预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及设置单元,用于对用户经由所述UI画面所选择的字符区域进行OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述预定处理所用的补充信息,其中,在用户选择多个字符区域的情况下,所述设置单元基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。

【技术特征摘要】
2017.08.22 JP 2017-1595401.一种用于对通过扫描文档所获得的扫描图像进行预定处理的设备,所述设备包括:显示控制单元,用于显示进行所述预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及设置单元,用于对用户经由所述UI画面所选择的字符区域进行OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述预定处理所用的补充信息,其中,在用户选择多个字符区域的情况下,所述设置单元基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。2.根据权利要求1所述的设备,其中,在用户当前选择的字符区域和紧挨在当前选择的字符区域之前选择的字符区域在特定方向上不连续的情况下,所述设置单元插入分隔符。3.根据权利要求2所述的设备,其中,所述设置单元基于当前选择的字符区域中的基准位置与紧挨在当前选择的字符区域之前选择的字符区域中的基准位置是否相同、以及当前选择的字符区域与紧挨在当前选择的字符区域之前选择的字符区域是否相邻,来判断当前选择的字符区域和紧挨在当前选择的字符区域之前选择的字符区域是否在特定方向上连续。4.根据权利要求3所述的设备,其中,在当前选择的字符区域和紧挨在当前选择的字符区域之前选择的字符区域之间不存在其它字符区域的情况下,所述设置单元判断为当前选择的字符区域与紧挨在当前选择的字符区域之前选择的字符区域相邻。5.根据权利要求4所述的设备,其中,在对当前选择的字符区域与紧挨在当前选择的字符区域之前选择的字符区域是否相邻进行判断的情况下,所述设置单元将这两个字符区域之间的距离与预定阈值进行比较,并且仅在该距离等于或小于所述预定阈值的情况下,才判断为这两个字符区域彼此相邻。6.根据权利要求5所述的设备,其中,所述预定阈值小于用户所选择的字符区域的高度的三倍。7.根据权利要求1所述的设备,其中,所述设置单元具有登记了多个单词的字典数据,以及在所述字典数据包括与从用户当前选择的字符区域中提取的字符串的开头一致的单词的情况下,所述设置单元进一步对与所选择的字符区域在特定方向上连续的字符区域进行所述OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述补充信息。8.根据权利要求2所述...

【专利技术属性】
技术研发人员:宫本大次郎
申请(专利权)人:佳能株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1