The invention relates to a device for pre-processing scanned images, a control method thereof and a storage medium. By using the character recognition result of the scanned image, the user can set additional information such as file name for the scanned image through simple operation. The device includes a display control unit for displaying a UI screen used for preset processing, which displays the character area of the scanned image in a manner that the user can select, and a setting unit for OCR processing of the character area selected by the user via the UI screen, and for setting the preset processing by using the string extracted in the OCR processing. In the case that the user selects multiple character regions, the setting unit determines whether a separator should be inserted between extracted strings based on the position relationship between the selected character regions, and inserts a separator between extracted strings when it is determined that a separator should be inserted.
【技术实现步骤摘要】
对扫描图像进行预定处理的设备、其控制方法和存储介质
本专利技术涉及使用扫描图像的字符识别结果并且为该扫描图像设置文件名等的技术。
技术介绍
传统上,通过扫描来数字化纸质文档的方法已被广泛用作文档管理方法。此外,在数字化文档时,存在对所扫描的图像数据进行光学字符识别处理(OCR处理)并且将所识别的字符用于数字化后的文档文件的文件名的技术。例如,日本特开2008-176624公开了如下的技术:针对所扫描的图像数据预先设置进行OCR处理的多个区域,然后根据表示预先设置的文件名的格式的规则和各区域的字符识别结果来设置文件名。日本特开2008-176624还公开了:在设置表示文件名的格式的规则时,可以在多个区域的字符识别结果之间添加诸如连字符等的特定符号(分隔符)。然而,在日本特开2008-176624所公开的方法中,需要针对各种文档设置OCR处理的对象区域和表示文件名的格式的规则。因此,为了向各种类型的文档适当地添加文件名,需要根据文档的类型来预先设置规则,这需要大量的时间和精力来完成该工作。另外,在日本特开2008-176624所公开的方法中,由于要在各区域的字符识别结果之间插入的分隔符遵循预先设置的规则,因此根据实际的扫描图像不能灵活地判断在添加文件名时是否插入分隔符。将参考附图给出具体示例。图1示出为报价单(quotation)的扫描图像设置文件名的情形。现在,假定对一个连续的字符串的每个区域(字符区域)进行OCR处理,并且设置在字符区域之间插入“_(下划线)”作为分隔符的规则。在图1所示的示例中,由于在“QUOTATION”的各字符(字母)之间存在空格,因 ...
【技术保护点】
1.一种用于对通过扫描文档所获得的扫描图像进行预定处理的设备,所述设备包括:显示控制单元,用于显示进行所述预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及设置单元,用于对用户经由所述UI画面所选择的字符区域进行OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述预定处理所用的补充信息,其中,在用户选择多个字符区域的情况下,所述设置单元基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。
【技术特征摘要】
2017.08.22 JP 2017-1595401.一种用于对通过扫描文档所获得的扫描图像进行预定处理的设备,所述设备包括:显示控制单元,用于显示进行所述预定处理所用的UI画面,所述UI画面以用户能够选择的方式显示所述扫描图像中的字符区域;以及设置单元,用于对用户经由所述UI画面所选择的字符区域进行OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述预定处理所用的补充信息,其中,在用户选择多个字符区域的情况下,所述设置单元基于多个所选择的字符区域之间的位置关系来判断是否应在所提取的字符串之间插入分隔符,并且在判断为应插入分隔符的情况下,在所提取的字符串之间插入分隔符。2.根据权利要求1所述的设备,其中,在用户当前选择的字符区域和紧挨在当前选择的字符区域之前选择的字符区域在特定方向上不连续的情况下,所述设置单元插入分隔符。3.根据权利要求2所述的设备,其中,所述设置单元基于当前选择的字符区域中的基准位置与紧挨在当前选择的字符区域之前选择的字符区域中的基准位置是否相同、以及当前选择的字符区域与紧挨在当前选择的字符区域之前选择的字符区域是否相邻,来判断当前选择的字符区域和紧挨在当前选择的字符区域之前选择的字符区域是否在特定方向上连续。4.根据权利要求3所述的设备,其中,在当前选择的字符区域和紧挨在当前选择的字符区域之前选择的字符区域之间不存在其它字符区域的情况下,所述设置单元判断为当前选择的字符区域与紧挨在当前选择的字符区域之前选择的字符区域相邻。5.根据权利要求4所述的设备,其中,在对当前选择的字符区域与紧挨在当前选择的字符区域之前选择的字符区域是否相邻进行判断的情况下,所述设置单元将这两个字符区域之间的距离与预定阈值进行比较,并且仅在该距离等于或小于所述预定阈值的情况下,才判断为这两个字符区域彼此相邻。6.根据权利要求5所述的设备,其中,所述预定阈值小于用户所选择的字符区域的高度的三倍。7.根据权利要求1所述的设备,其中,所述设置单元具有登记了多个单词的字典数据,以及在所述字典数据包括与从用户当前选择的字符区域中提取的字符串的开头一致的单词的情况下,所述设置单元进一步对与所选择的字符区域在特定方向上连续的字符区域进行所述OCR处理,并且通过使用在所述OCR处理中所提取的字符串来设置所述补充信息。8.根据权利要求2所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。