字符识别系统及字符识别方法技术方案

技术编号:21009996 阅读:38 留言:0更新日期:2019-05-03 22:14
本发明专利技术提供即使在包括字符种类不同的复式记录的票据时也能提高精度和效率并能减轻用户的作业负担的字符识别系统及字符识别方法。字符识别系统包括:票据输入部,获得票据的图像数据;字符识别部,根据票据的图像数据,对作为两个字段的两个字符串的第一字段的第一字符串和第二字段的第二字符串进行字符识别,获得识别结果字符数据;转换部,根据识别结果字符数据,当第一字符串的字符种类与第二字符串的字符种类不同时,将一个字符串转换成与另一个字符串字符种类匹配,获得转换结果字符数据;比较部,根据转换结果字符数据,比较第一字符串和第二字符串,判断一致或不一致,获得比较结果数据;及输出部,向用户输出包括比较结果数据的输出数据。

【技术实现步骤摘要】
字符识别系统及字符识别方法
本专利技术涉及利用OCR(OpticalCharacterReader:光符阅读器)的字符识别技术。
技术介绍
利用了OCR的字符识别系统从账单、支票等票据读取图像,识别记在票据栏中的字符,获得其字符数据。用户通过画面查看该字符数据,进行票据填入内容的确认,数据的修改或确定等作业。作为利用了OCR的字符识别系统相关的在先技术的例子,例如可列举日本特开2002-92545号公报(专利文献1)。专利文献1中公开了对填在票据两栏中的两个金额的字符进行字符识别的内容。在先技术文献专利文献专利文献1:日本特开2002-92545号公报
技术实现思路
专利技术要解决的技术问题有时会在票据中的两栏或者两处填入具有对应关系的两个字符串作为复式记录。对于金额等重要的信息,有时出于确保正确性、防止窜改等目的进行复式记录。复式记录有时还被称为复填。有些票据中同时设有用于复式记录的两个栏。例如,在账单中,往金额的填入栏填入金额的字符串,往复填栏中填入与填入栏的金额相同金额的字符串。现有的字符识别系统在对票据的复式记录的两个字符串只是分别进行字符识别来获得数据时,未对两个字符串的对应关系进行判断。这时,用户获得错误的金额等字符串的可能性、没有注意到两个字符串不一致的可能性高。专利文献1中公开的技术是适用于在票据的两栏中以相同种类的字符、例如阿拉伯数字填入了相同金额的情况的技术。但是,也存在在票据的复式记录的两栏或者两处以不同种类的字符填入或印刷相同金额的情况。例如,在填入栏以阿拉伯数字填入金额,在复填栏中以汉字数字填入相同的金额。如果是没有复填栏的票据,有时也会在接近填入栏的地方填入金额。在上述情况下,由于两个金额的字符种类不同,因此,现有的字符识别系统无法进行简单比较以及对应关系的判断等。用户需要看两个金额的字符识别结果,对两个金额进行比较来判断及确认是否有金额的误填、窜改等可能性。用户需要对每个票据进行这样的作业,消耗劳力和时间。尤其是,当两个金额的字符种类不同时,与字符种类相同时相比,用户更加难以一眼就能进行金额的比较、判断。并且,当介入有用户的票据确认等作业时,进行多个票据的处理的字符识别系统需要暂停处理。为此,为了处理多个票据需要消耗较长时间,用户的作业负担增大。如上所述,关于包括复式记录的票据的字符识别,现有的字符识别系统从精度、效率的观点来看具有改善的余地。本专利技术的目的在于,针对字符识别系统,提供一种即使在包括字符种类不同的复式记录的票据时,也能提高精度和效率,减轻用户的作业负担的技术。用于解决技术问题的方案本专利技术中的代表性的实施方式是一种字符识别系统以及字符识别方法,其特征在于具有以下所示的构成。一实施方式的字符识别系统包括:票据(帳票)输入部,输入票据,并获得该票据的图像数据;字符识别部,根据所述票据的所述图像数据,对作为两个字段的两个字符串的第一字段的第一字符串和第二字段的第二字符串进行字符识别,获得识别结果字符数据;转换部,根据所述识别结果字符数据,在所述第一字符串的字符种类与所述第二字符串的字符种类不同时,对一个字符串进行转换,使所述一个字符串的字符种类与另一个字符串的字符种类匹配,从而获得转换结果字符数据;比较部,根据所述转换结果字符数据,比较所述第一字符串和所述第二字符串,并判断一致或不一致,从而获得比较结果数据;以及输出部,向用户输出包括所述比较结果数据的输出数据。专利技术效果根据本专利技术中的代表性的实施方式,关于字符识别系统,即使是在包括字符种类不同的复式记录(二重エントリ)的票据的情况下,也能提高精度和效率,减轻用户的作业负担。附图说明图1是示出本专利技术的实施方式一的字符识别系统的构成的图。图2的(a)~(c)是示出实施方式一中的票据的具体例子的图。图3是示出实施方式一中的处理及作业的简要流程的图。图4是示出实施方式一中的误读减少模式时的处理流程的图。图5是示出实施方式一中的读取指定时的画面例子的图。图6的(a)~(d)是示出实施方式一中的目标位置的读取例子的图。图7的(a)~(c)是示出实施方式一中的位置偏移校正处理的例子的图。图8的(a)~(c)是示出实施方式一中的位数比较处理的例子的图。图9的(a)和(b)是示出实施方式一中的字符串转换处理的例子的图。图10的(a)和(b)是示出实施方式一中的用于字符串转换处理的转换表的例子的图。图11是示出实施方式一中的第一转换时的转换处理流程的图。图12是示出实施方式一中的第二转换时的转换处理流程的图。图13的(a)~(c)是示出实施方式一中的字符串比较处理的例子的图。图14的(a)~(c)是示出实施方式一中的窜改可能性判断处理的例子的图。图15的(a)~(d)是示出实施方式一中的结果画面的输出例子的图。图16的(a)和(b)是示出实施方式一中的结果画面的输出例子的图。图17是示出实施方式一中的不可读减少模式时的处理流程的图。图18是示出实施方式一中的第一转换时的包括转换处理及比较处理的流程的图。图19是示出实施方式一中的第二转换时的包括转换处理及比较处理的流程的图。图20是示出实施方式一中的作为有不可读时的处理的、第一转换时的例子的图。图21的(a)和(b)是示出实施方式一中的有不可读时的处理表的例子的图。图22是示出本专利技术的实施方式二的字符识别系统的构成的图。具体实施方式下面,基于附图详细说明本专利技术的实施方式。需要注意的是,在用于说明实施方式的所有图中,对相同部位原则上标注相同的标记,并省略其重复说明。(实施方式一)利用图1~图21对本专利技术的实施方式一的字符识别系统以及字符识别方法进行说明。实施方式一的字符识别系统是利用OCR进行票据的字符识别处理的系统。实施方式一的字符识别方法是包括在实施方式一的字符识别系统上基于用户的操作由计算机来执行的处理步骤的方法。对于填入票据两处作为复式记录的两个金额等字符串,实施方式一的字符识别系统提供即使在这些字符的种类不同时也自动进行字符种类的转换、比较以及判断等高级功能。字符识别系统比较两个字符串,判断一致及不一致、误填、窜改等的可能性,根据其结果,向用户输出包括告警等的结果画面,并保存输出数据。由此,帮助用户完成票据确认、修改等作业。[字符识别系统]图1示出了实施方式一的字符识别系统的构成。实施方式一的字符识别系统通过OCR装置1和PC2的连接而构成。实施方式一的字符识别系统在PC2中进行有关票据5的OCR处理的主处理。换言之,实施方式一的字符识别系统是软件OCR方式的系统。OCR装置1是进行票据5的OCR处理中的、到获得票据5的图像数据为止的处理的装置。PC2是通过软件处理来进行OCR处理的装置。换言之,OCR处理是获得票据5的数据化,字符串数据的处理。用户利用实施方式一的字符识别系统操作OCR装置1以及PC2。用户进行票据5的记载内容的确认、数据的修改、确定等作业作为与票据5的OCR处理有关的作业。票据5是用于指定的业务中的指定形式的票据,例如是账单、支票。未图示的填单人在票据5的栏内手写填入金额等字符。或者,利用写入器(writer)等设备在票据5的栏内打印金额等字符。用户接收提交的票据5。为了进行作业,用户将一张以上的票据5安放并输入OCR装置1。用户操作PC2,进行与作业相关的本文档来自技高网...

【技术保护点】
1.一种字符识别系统,包括:票据输入部,输入票据,并获得该票据的图像数据;字符识别部,根据所述票据的所述图像数据,对作为两个字段的两个字符串的第一字段的第一字符串和第二字段的第二字符串进行字符识别,获得识别结果字符数据;转换部,根据所述识别结果字符数据,在所述第一字符串的字符种类与所述第二字符串的字符种类不同时,对一个字符串进行转换,使所述一个字符串的字符种类与另一个字符串的字符种类匹配,从而获得转换结果字符数据;比较部,根据所述转换结果字符数据,比较所述第一字符串和所述第二字符串,并判断一致或不一致,从而获得比较结果数据;以及输出部,向用户输出包括所述比较结果数据的输出数据,所述字符识别系统具有判断表,在所述判断表中设定有所述第一字符串的字符、所述第二字符串的字符以及对于所述第一字符串的字符的窜改候选字符的组合,所述比较部针对判断为所述不一致的所述第一字符串的字符和所述第二字符串的字符,根据是否符合所述判断表的所述组合来判断包括对于所述第一字符串的字符的窜改的可能性,并输出判断结果。

【技术特征摘要】
2014.11.17 JP 2014-2325211.一种字符识别系统,包括:票据输入部,输入票据,并获得该票据的图像数据;字符识别部,根据所述票据的所述图像数据,对作为两个字段的两个字符串的第一字段的第一字符串和第二字段的第二字符串进行字符识别,获得识别结果字符数据;转换部,根据所述识别结果字符数据,在所述第一字符串的字符种类与所述第二字符串的字符种类不同时,对一个字符串进行转换,使所述一个字符串的字符种类与另一个字符串的字符种类匹配,从而获得转换结果字符数据;比较部,根据所述转换结果字符数据,比较所述第一字符串和所述第二字符串,并判断一致或不一致,从而获得比较结果数据;以及输出部,向用户输出包括所述比较结果数据的输出数据,所述字符识别系统具有判断表,在所述判断表中设定有所述第一字符串的字符、所述第二字符串的字符以及对于所述第一字符串的字符的窜改候选字符的组合,所述比较部针对判断为所述不一致的所述第一字符串的字符和所述第二字符串的字符,根据是否符合所述判断表的所述组合来判断包括对于所述第一字符串的字符的窜改的可能性,并输出判断结果。2.根据权利要求1所述的字符识别系统,其中,所述票据在所述第一字符串中包括阿拉伯数字的金额,在所述第二字符串中包括汉字数字的金额,所述字符识别系统具有转换表,在所述转换表中设定有与所述字符种类不同的所述两个字符串相关的每个字符的对应关系,所述转换部使用所述转换表转换所述第二字符串,使所述第二字符串的汉字数字与所述第一字符串的阿拉伯数字匹配。3.根据权利要求1所述的字符识别系统,其中,所述票据在所述第一字符串中包括阿拉伯数字的金额,在所述第二字符串中包括汉字数字的金额,所述字符识别系统具有转换表,在所述转换表中设定有与所述字符种类不同的所述两个字符串相关的每个字符的对应关系,所述转换部使用所述转换表转换所述第一字符串,使所述第一字符串的阿拉伯数字与所述第二字符串的汉字数字匹配。4.根据权利要求1所述的字符识别系统,其中,所述字符识别系统若基于所述识别结果字符数据,在所述字段的区域内未发现所述字符串,则在扩展到该区域外侧的范围内搜索所述字符串,当未发现所述字符串时,将结果设为有空白,当发现了所述字符串时,将该字符串包括在所述识别结果字符数据中,并将结果设为无空白而输出该结果。5.根据权利要求1所述的字符识别系统,其中,所述字符识别系统基于所述识别结果字符数据,判断所述第一字符串的位数和所述第二字符串的位数,并比较所述第一字符串的位数与所述第二字符串的位数,判断该位数的一致或不一致而输出该判断的结果。6.根据权利要求1所述的字符识别系统,其中,所述字符识别系统具有用户界面部,所述用户界面部向所述用户输出基于所述用户的操作的指示输入的画面、和基于所述输出数据的结果画面,所述指示输入的画面包括用于指定所述两个字段、所述两个字符串各自的字符种类、和作为所述转换的对象的字符串的项目。7.根据权利要求1所述的字符识别系统,其中,所述字符识别系统具有用户界面部,所述用户界面部向所述用户输出基于所述用户的操作的指示输入的画面、和基于所述输出数据的结果画面,所述结果画面包括所述第一字符串的所述字符识别的结果的数据、所述第二字符串的所述字符识别的结果的数据或者所述第二字符串的所述转换的结果的数据、所述一致或不一致的判断结果、和所述不一致时的告警。8.根据权利要求1所述的字符识别系统,其中,所述字符识别系统具有用户界面部,所述用户界面部向所述用户输出基于所述用户的操作的指示输入的画面、和基于所述输出数据的结果画面,所述结果画面包括所述第一字符串的所述字符识别的结果的数据、所述第二字符串的所述字符识别的结果的数据或者所述第二字符串的所述转换的结果的数据、所述一致或不一致的判断结果、在所述不一致时的包括对所述第一字符串的字符的窜改的可能性的判断结果、和包括所述窜改的可能性的告警。9...

【专利技术属性】
技术研发人员:横井博树中岛和树
申请(专利权)人:株式会社日立信息通信工程
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1