【技术实现步骤摘要】
字符识别系统及字符识别方法
本专利技术涉及利用OCR(OpticalCharacterReader:光符阅读器)的字符识别技术。
技术介绍
利用了OCR的字符识别系统从账单、支票等票据读取图像,识别记在票据栏中的字符,获得其字符数据。用户通过画面查看该字符数据,进行票据填入内容的确认,数据的修改或确定等作业。作为利用了OCR的字符识别系统相关的在先技术的例子,例如可列举日本特开2002-92545号公报(专利文献1)。专利文献1中公开了对填在票据两栏中的两个金额的字符进行字符识别的内容。在先技术文献专利文献专利文献1:日本特开2002-92545号公报
技术实现思路
专利技术要解决的技术问题有时会在票据中的两栏或者两处填入具有对应关系的两个字符串作为复式记录。对于金额等重要的信息,有时出于确保正确性、防止窜改等目的进行复式记录。复式记录有时还被称为复填。有些票据中同时设有用于复式记录的两个栏。例如,在账单中,往金额的填入栏填入金额的字符串,往复填栏中填入与填入栏的金额相同金额的字符串。现有的字符识别系统在对票据的复式记录的两个字符串只是分别进行字符识别来获得数据时,未对两个字符串的对应关系进行判断。这时,用户获得错误的金额等字符串的可能性、没有注意到两个字符串不一致的可能性高。专利文献1中公开的技术是适用于在票据的两栏中以相同种类的字符、例如阿拉伯数字填入了相同金额的情况的技术。但是,也存在在票据的复式记录的两栏或者两处以不同种类的字符填入或印刷相同金额的情况。例如,在填入栏以阿拉伯数字填入金额,在复填栏中以汉字数字填入相同的金额。如果是没有复填栏的票据,有时 ...
【技术保护点】
1.一种字符识别系统,包括:票据输入部,输入票据,并获得该票据的图像数据;字符识别部,根据所述票据的所述图像数据,对作为两个字段的两个字符串的第一字段的第一字符串和第二字段的第二字符串进行字符识别,获得识别结果字符数据;转换部,根据所述识别结果字符数据,在所述第一字符串的字符种类与所述第二字符串的字符种类不同时,对一个字符串进行转换,使所述一个字符串的字符种类与另一个字符串的字符种类匹配,从而获得转换结果字符数据;比较部,根据所述转换结果字符数据,比较所述第一字符串和所述第二字符串,并判断一致或不一致,从而获得比较结果数据;以及输出部,向用户输出包括所述比较结果数据的输出数据,所述字符识别系统具有判断表,在所述判断表中设定有所述第一字符串的字符、所述第二字符串的字符以及对于所述第一字符串的字符的窜改候选字符的组合,所述比较部针对判断为所述不一致的所述第一字符串的字符和所述第二字符串的字符,根据是否符合所述判断表的所述组合来判断包括对于所述第一字符串的字符的窜改的可能性,并输出判断结果。
【技术特征摘要】
2014.11.17 JP 2014-2325211.一种字符识别系统,包括:票据输入部,输入票据,并获得该票据的图像数据;字符识别部,根据所述票据的所述图像数据,对作为两个字段的两个字符串的第一字段的第一字符串和第二字段的第二字符串进行字符识别,获得识别结果字符数据;转换部,根据所述识别结果字符数据,在所述第一字符串的字符种类与所述第二字符串的字符种类不同时,对一个字符串进行转换,使所述一个字符串的字符种类与另一个字符串的字符种类匹配,从而获得转换结果字符数据;比较部,根据所述转换结果字符数据,比较所述第一字符串和所述第二字符串,并判断一致或不一致,从而获得比较结果数据;以及输出部,向用户输出包括所述比较结果数据的输出数据,所述字符识别系统具有判断表,在所述判断表中设定有所述第一字符串的字符、所述第二字符串的字符以及对于所述第一字符串的字符的窜改候选字符的组合,所述比较部针对判断为所述不一致的所述第一字符串的字符和所述第二字符串的字符,根据是否符合所述判断表的所述组合来判断包括对于所述第一字符串的字符的窜改的可能性,并输出判断结果。2.根据权利要求1所述的字符识别系统,其中,所述票据在所述第一字符串中包括阿拉伯数字的金额,在所述第二字符串中包括汉字数字的金额,所述字符识别系统具有转换表,在所述转换表中设定有与所述字符种类不同的所述两个字符串相关的每个字符的对应关系,所述转换部使用所述转换表转换所述第二字符串,使所述第二字符串的汉字数字与所述第一字符串的阿拉伯数字匹配。3.根据权利要求1所述的字符识别系统,其中,所述票据在所述第一字符串中包括阿拉伯数字的金额,在所述第二字符串中包括汉字数字的金额,所述字符识别系统具有转换表,在所述转换表中设定有与所述字符种类不同的所述两个字符串相关的每个字符的对应关系,所述转换部使用所述转换表转换所述第一字符串,使所述第一字符串的阿拉伯数字与所述第二字符串的汉字数字匹配。4.根据权利要求1所述的字符识别系统,其中,所述字符识别系统若基于所述识别结果字符数据,在所述字段的区域内未发现所述字符串,则在扩展到该区域外侧的范围内搜索所述字符串,当未发现所述字符串时,将结果设为有空白,当发现了所述字符串时,将该字符串包括在所述识别结果字符数据中,并将结果设为无空白而输出该结果。5.根据权利要求1所述的字符识别系统,其中,所述字符识别系统基于所述识别结果字符数据,判断所述第一字符串的位数和所述第二字符串的位数,并比较所述第一字符串的位数与所述第二字符串的位数,判断该位数的一致或不一致而输出该判断的结果。6.根据权利要求1所述的字符识别系统,其中,所述字符识别系统具有用户界面部,所述用户界面部向所述用户输出基于所述用户的操作的指示输入的画面、和基于所述输出数据的结果画面,所述指示输入的画面包括用于指定所述两个字段、所述两个字符串各自的字符种类、和作为所述转换的对象的字符串的项目。7.根据权利要求1所述的字符识别系统,其中,所述字符识别系统具有用户界面部,所述用户界面部向所述用户输出基于所述用户的操作的指示输入的画面、和基于所述输出数据的结果画面,所述结果画面包括所述第一字符串的所述字符识别的结果的数据、所述第二字符串的所述字符识别的结果的数据或者所述第二字符串的所述转换的结果的数据、所述一致或不一致的判断结果、和所述不一致时的告警。8.根据权利要求1所述的字符识别系统,其中,所述字符识别系统具有用户界面部,所述用户界面部向所述用户输出基于所述用户的操作的指示输入的画面、和基于所述输出数据的结果画面,所述结果画面包括所述第一字符串的所述字符识别的结果的数据、所述第二字符串的所述字符识别的结果的数据或者所述第二字符串的所述转换的结果的数据、所述一致或不一致的判断结果、在所述不一致时的包括对所述第一字符串的字符的窜改的可能性的判断结果、和包括所述窜改的可能性的告警。9...
【专利技术属性】
技术研发人员:横井博树,中岛和树,
申请(专利权)人:株式会社日立信息通信工程,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。