OCR系统技术方案

技术编号:28048622 阅读:16 留言:0更新日期:2021-04-09 23:39
OCR系统通过OCR处理从票据(50)中获取字符数据,其特征在于,用于管理将票据(50)的发行人的发行人名称与OCR处理所使用字体的字体名称进行关联的OCR用信息表(34e),在针对票据(50)中的发行人记载内容读取对象区域执行OCR处理的情况下,基于在OCR用信息表中与该票据(50)的发行人的发行人名称相关联的字体名称所指的字体,来执行OCR处理(S156)。

【技术实现步骤摘要】
【国外来华专利技术】OCR系统
本专利技术涉及一种OCR系统,通过OCR处理从文档中获取字符数据。
技术介绍
现有技术中,已知有一种通过OCR处理从文档的特定区域内获取字符数据的OCR系统(例如,参照专利文献1)。〔专利文献〕专利文献1:日本特开2010-073201号公报
技术实现思路
然而,现有的OCR系统中,在文档的特定区域内的字符字体种类与针对该区域的OCR处理所使用的字体种类不同的情况下,有时会产生OCR处理的字符识别精度降低这一问题。还有,现有的OCR系统中,OCR处理的可靠性根据文档的不同而不同,但用户无法知道OCR处理对于具体某个文档的可靠性,因此,当需要对通过OCR处理从文档中获取的字符数据进行校正时,会存在字符数据的校正工作负担很重的问题。而且,现有的OCR系统中,在用户期望作为特定信息来获得的字符串中至少有一个字符未被特定信息标记覆盖的情况下,就不会将未被特定信息标记覆盖的字符作为特定信息的一部分来获取,因此就存在不能正确获取用户所期望的字符串这一问题。由此,本专利技术的目的在于提供本文档来自技高网...

【技术保护点】
1.一种OCR系统,通过OCR处理从文档中获取字符数据,其特征在于,/n具备OCR用信息管理部和OCR执行部,/n所述OCR用信息管理部用于管理将所述文档的发行人的标识信息与OCR处理所使用字体的种类进行关联的OCR用信息,/n所述OCR执行部用于执行针对所述文档的OCR处理,/n所述OCR执行部在针对所述文档中的特定区域执行OCR处理的情况下,使用所述OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述种类的字体,来执行OCR处理。/n

【技术特征摘要】
【国外来华专利技术】20180827 JP 2018-158182;20180827 JP 2018-158183;201.一种OCR系统,通过OCR处理从文档中获取字符数据,其特征在于,
具备OCR用信息管理部和OCR执行部,
所述OCR用信息管理部用于管理将所述文档的发行人的标识信息与OCR处理所使用字体的种类进行关联的OCR用信息,
所述OCR执行部用于执行针对所述文档的OCR处理,
所述OCR执行部在针对所述文档中的特定区域执行OCR处理的情况下,使用所述OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述种类的字体,来执行OCR处理。


2.根据权利要求1所述的OCR系统,其特征在于,
所述文档包含该文档的所述发行人的所述标识信息,
所述OCR执行部通过针对所述文档的OCR处理,获取该文档的所述发行人的所述标识信息,并使用所述OCR用信息中与获取的所述标识信息相关联的所述种类的字体,针对该文档的所述特定区域执行OCR处理。


3.根据权利要求1所述的OCR系统,其特征在于,
带标记文档是指附加了区域用标记的所述文档,所述区域用标记用于确定所述特定区域,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,确定出所述区域用标记所确定的所述特定区域内的字符字体的所述种类,
所述OCR执行部从所述带标记文档中确定出所述种类后,所述OCR用信息管理部将所述种类包含在所述OCR用信息中。


4.根据权利要求3所述的OCR系统,其特征在于,
所述带标记文档中附加了标识信息标记,所述标识信息标记用于获取所述带标记文档的所述发行人的所述标识信息,
所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,获取由所述标识信息标记确定出的所述标识信息,
所述OCR执行部从所述带标记文档中获取到所述标识信息后,所述OCR用信息管理部将所述标识信息包含在所述OCR用信息中。


5.根据权利要求4所述的OCR系统,其特征在于,
所述特定区域的上端一边的位置是指与所述文档中的所述标识信息标记的纵向上的最上部位置隔着特定距离的上侧位置,
所述特定区域的下端一边的位置是指与所述文档中的所述标识信息标记的纵向上的最下部位置隔着特定距离的下侧位置,
所述特定区域的左端一边的位置是指与所述文档中的所述标识信息标记的横向上的最左边位置隔着特定距离的左侧位置,
所述特定区域的右端一边的位置是指与所述文档中的所述标识信息标记的横向上的最右边位置隔着特定距离的右侧位置。


6.一种OCR系统,通过OCR处理从文档中获取字符数据,其特征在于,
具备OCR用信息管理部、OCR执行部和校正受理部,
所述OCR用信息管理部用于管理将所述文档的发行人的标识信息与针对该发行人所发行的所述文档执行OCR处理的可靠性进行关联的OCR用信息,
所述OCR执行部用于执行针对所述文档的OCR处理,
所述校正受理部用于受理所述字符数据的校正,
带标记文档是指附加了可靠性标记的所述文档,所述可靠性标记用于表示所述可靠性,所述OCR执行部在针对所述带标记文档执行OCR处理的情况下,获取由所述可靠性标记表示的所述可靠性,
所述OCR执行部从所述带标记文档中获取所述可靠性后,所述OCR用信息管理部将所述可靠性包含在所述OCR用信息中,
在所述文档的所述字符数据的校正时,所述校正受理部根据所述OCR用信息中与该文档的所述发行人的所述标识信息相关联的所述可靠性,来执行消息通知。


7.根据权利要求6所述的OCR系统,其特征在于,
所述文档中包含该文档的所述发行人的所述标识信息,
所述OCR执行部通过针对所述文档的OCR处理,获取该文档的所述发行人的所述标识信息,
在所述文档的所述字符数据的校正时,所述校正受理部根据所述OCR用信息中与所述OCR执行部从所述文档中获取的所述标识信息相关联的所述可靠性,来执行消息通知。


8.根据权利要求6所述的OCR系统,其特征在于,
所述带标记文档中附加了标识信息标记,所述标识信息标记用于获取所述带标记文档的所述发行人的所述标识信息,
所述OCR执行部在针对所述带标记文档执行OC...

【专利技术属性】
技术研发人员:川崎智广
申请(专利权)人:京瓷办公信息系统株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1