字符识别装置及方法制造方法及图纸

技术编号:15398363 阅读:62 留言:0更新日期:2017-05-22 14:02
一种字符识别装置、方法及程序,能在抑制正读率的降低幅度的同时进行降低了误读率的高效的舍弃,并能减少舍弃判定所需的计算量。使基于各种指标的舍弃判定(109、113)在舍弃值彼此的独立性高的情况下串行组合,在舍弃值彼此的独立性低的情况下并行组合。舍弃率高的舍弃指标、计算成本低的舍弃指标配置在处理的前期。字符识别部(106)识别字符切取部(105)切取出的各字符单位的图像中的字符。多个舍弃值计算(107、108、110~112)将舍弃能力越高的舍弃值计算(107、108)越在先配置。舍弃判定在基于在先的舍弃值计算所计算出的舍弃值而判定为舍弃时,省略在后的舍弃值计算处理,由此判定是否舍弃识别结果。

Character recognition device and method

A character recognition device, method and program capable of efficiently reducing the rate of misreading while suppressing the reduction of the positive reading rate, and reducing the amount of computation required to give up judgment. A set of decisions (109, 113) based on various indexes are serially combined under the high independence of the abandonment values, and the combination is carried out in a case where the independence of the rejected values is low. Abandon index with high abandonment rate and abandon index with low calculation cost are arranged in the prophase of treatment. The character recognition unit (106) identifies characters in the image of each character unit cut by the character cut section (105). Multiple discard values (107, 108, 110~112) compute the discard value (107, 108) of the higher the ability to discard, the earlier the configuration. When a decision is determined to be discarded, based on the calculated discard value based on the prior abandonment value, the drop value is calculated after omitting the discard value, thereby determining whether or not the recognition result is discarded.

【技术实现步骤摘要】
字符识别装置及方法
本专利技术涉及字符识别装置及方法、字符识别程序,尤其涉及具有组合了多个舍弃值的舍弃判定方式的光学式字符识别装置及方法、字符识别程序。另外,本实施例在字符识别的技术中尤其还涉及舍弃的技术。
技术介绍

涉及光学式字符识别(OCR:OpticalCharacterRecognition;光学字符识别)装置。OCR装置通过扫描仪等读取纸类文件,并识别图像中的文字和/或符号,由此,通过代码化成Unicode(统一码)等来进行电子化。OCR装置在一般企业、自治机构、金融机构、医疗机构、教育机构等中,用于会计票据、缴纳完成通知书、工资报告单、订单、成批转账单、医疗费用明细、答题纸等的电子化。另外,面向一般用户时,在基于移动电话进行的字符识别、便签等一般文件中的字符识别中使用。简略地说明基于OCR装置的文件电子化的处理流程。图6是用于说明基于字符识别装置的文件电子化的流程图。首先,进行基于扫描仪等的文件图像化、二值化和噪声处理等的前处理。由此,例如能够得到图6的附图标记601那样的二值的文件图像。接下来,通过基于OCR装置进行的、图表位置和/或文件段落构造等的布局分析和字符串提取,而得到例如图6的附图标记602那样的字符串图像。之后,OCR装置通过字符切取而从字符串图像中切取字符单位的图像,然后,识别各个图像中的字符。从文件的图像化到字符串提取为止的处理例如在专利文件1、专利文献2中有所记载。另外,到从字符串图像中识别各个字符为止的处理例如在专利文献3、非专利文献1、非专利文献2中有所记载。本技术涉及各个字符图像的识别技术。以下,简单说明对各个字符图像中描绘的字符进行识别的技术。首先,进行将字符图像转换为矢量值的特征提取处理。当将矢量值的维数设为N时,通过特征提取处理而将一个字符图像表现为N维矢量。从相同字符种类的字符图像中提取的N维矢量分布在N维空间中的较近位置上。图9通过示意图而示出上述情况。圆形、三角形、四边形分别表示从与字符种类A、字符种类B、字符种类C对应的各字符图像提取出的矢量值。接下来,参照预先生成的字符识别用辞典,基于从字符图像提取出的矢量值,来识别字符图像中描绘的字符。在此,首先说明字符识别辞典。在字符识别用辞典中,例如对于各识别对象字符种类k而保存有将N维矢量取为自变量、将实数值取为值的识别函数fk(x)。识别函数fk(x)是以针对从描绘有字符种类k的字符图像所生成的N维矢量x而取较大值,针对从描绘有其他字符种类的字符图像所生成的N维矢量x而取较小值的方式,预先通过学习而生成的。识别函数fk(x)的值称为相对于矢量x的字符种类k的相似度、似然度(likelihood)等。例如,在将数字作为对象来识别的情况下,与0~9这十个数字种类对应地存在有10个识别函数f0(x)、f1(x)、…、f9(x)。在字符的识别中,使用从字符图像提取出的N维矢量x,来计算各字符种类的识别函数fk(x)的值。识别函数fk(x)的值是相对于字符种类k的相似度,由此,fk(x)的值最大的字符种类k成为识别结果的第一候选。同样地,值第二大的识别函数对应的字符种类k成为识别结果的第二候选。这样,能够得到直到第n候补的识别结果。图7是用于说明字符识别结果的图。例如,通过图6的字符切取(附图标记603)所切取的字符图像的识别如图7所示。通过以上内容,得到图6的附图标记604那样的识别结果,并转换为计算机能处理的字符代码等的代码。上述所说明的字符识别是计算字符图像和各识别对象字符种类的相似度,并基于此而得到候选字符的处理。为了提高OCR装置的有用性,该字符识别的精度是重要的。但是,在识别结果可疑的情况下,使通知该情况的识别结果的舍弃处理也是重要的。图12是用于表示非字符和不明确字符的示例的图。在成为舍弃对象的字符中,具有例如图12的字符例1201所示的非字符、和字符串1202所示的不明确字符。非字符例如是基于字符切取错误所导致的字符的一部分和/或多个字符合在一起的图像、混入了污渍等干扰因素的图像等。不明确字符例如是如字符例1202的左端图像所示地无法区别7和9的情况等。若舍弃处理是细致的,则具有几个优点。一个优点是,如果将错误地识别了字符的结果直接保存的话,则不是该错误的状态被保持,就是为了修正该错误而必须通过人工对所有识别结果进行再核查。与之相对,在识别结果可疑的情况下,只要能够将该情况通知给用户,用户就可以仅修正该部分。另外,若能够高精度地进行舍弃,则判定为作为舍弃的因素是可能在前处理、字符行提取、字符切取等在前的处理中发生了失误,从而能够从在前的任一个处理开始改变处理方法和/或处理条件等,再次尝试进行处理。由此,能够提高识别精度。以下,将正确地识别字符图像中的字符的比率称为正读率,将错误地识别的比率称为误读率,将舍弃识别结果的比率称为舍弃率。正读率、误读率、舍弃率的和为1。通常,若舍弃过多,则不仅将误读的内容舍弃,还会将正确读取的一些内容舍弃,由此,正读率、误读率均下降。由此,希望以尽量不降低正读率且使误读率减少的方式进行舍弃。说明舍弃的方法。将从输入图像提取出的N维矢量设为x。另外,将与第一候选字符k1对应的识别函数设为fk1。此时,fk1(x)是相对于字符种类k1的相似度。若使r1(x)=﹣fk1(x),则r1(x)能够视为相对于字符种类k1的非相似度。由此,预先确定阈值h1,在r1(x)>h1时,作为非相似度较高(相似度较低)而作出舍弃的判定。可以设想在输入图像为非字符时相对于第一候选字符的相似度也会较低,因此该方法考虑到了舍弃非字符的情况。而且,将与第二候选字符k2对应的识别函数设为fk2。此时,fk2(x)是相对于字符种类k2的相似度。另外,fk1(x)≥fk2(x)。若使r2(x)=fk2(x)-fk1(x),则该r2(x)的值越大,fk1(x)与fk2(x)的值越接近。此时,表示在第一候选字符与第二候选字符之间识别是不明确的。由此,预先确定阈值h2,在r2(x)>h2时,作为识别结果是不明确的而进行舍弃。图13是用于表示成为舍弃对象的图像示例的图。除此之外,在专利文献4中记载了如下进行舍弃判定的方法:计算图13的字符例1301那样的字符的断线程度r3(x)、和字符例1302那样的字符的团块程度r4(x),并基于这些进行舍弃判定。预先确定阈值h3,在r3(x)>h3时断线程度较大,所以舍弃。另外,预先确定阈值h4,在r4(x)>h4时团块程度较大,所以舍弃。现有技术文献专利文献专利文献1:日本特开2010-244372号公报专利文献2:日本特开平11-53466号公报专利文献3:日本特开2004-171316号公报专利文献4:日本特愿2011-212308号非专利文献非专利文献1:MohammedCheriet,NawwafKharma,ChenglinLiu,andChingSuen.CharacterRecognitionSystems:AGuideforStudentsandPractitioners.Wiley-Interscience,2007.非专利文献2:石井健一郎、上田修功、前田英作、村濑洋。图案识别。日本欧姆(OHM)社出版社。关于用于舍弃字符的指标,如上本文档来自技高网...
字符识别装置及方法

【技术保护点】
一种字符识别装置,其特征在于,具有:多个舍弃值计算部,其基于预先设定的舍弃函数对从输入图像而识别的字符的识别结果计算舍弃值;和一个或多个舍弃判定部,其基于由多个所述舍弃值计算部的某一个或某些个计算出的一个或多个舍弃值,分别判定是否将所述识别结果舍弃,使用基于多个所述舍弃值计算部的相关性而组合的多个所述舍弃值计算部,所述舍弃判定部基于多个舍弃值来进行所述识别结果的舍弃判定,并将判定为舍弃的所述识别结果舍弃,由此,将没有判定为舍弃的所述识别结果保存在存储部中或显示在显示部中。

【技术特征摘要】
2012.12.07 JP 2012-2685491.一种字符识别装置,其特征在于,具有:多个舍弃值计算部,其基于预先设定的舍弃函数对从输入图像而识别的字符的识别结果计算舍弃值;和一个或多个舍弃判定部,其基于由多个所述舍弃值计算部的某一个或某些个计算出的一个或多个舍弃值,分别判定是否将所述识别结果舍弃,使用基于多个所述舍弃值计算部的相关性而组合的多个所述舍弃值计算部,所述舍弃判定部基于多个舍弃值来进行所述识别结果的舍弃判定,并将判定为舍弃的所述识别结果舍弃,由此,将没有判定为舍弃的所述识别结果保存在存储部中或显示在显示部中。2.根据权利要求1所述的字符识别装置,其特征在于,在基于在先的所述舍弃值计算部所计算出的舍弃值而判定为舍弃的情况下,跳过由在后的所述舍弃值计算部进行的舍弃值的计算。3.根据权利要求1所述的字符识别装置,其特征在于,构成为越是舍弃能力或舍弃率高的计算舍弃值的所述舍弃值计算部,越在先配置地进行计算处理。4.根据权利要求1所述的字符识别装置,其特征在于,构成为将对多个舍弃值中独立性较高的舍弃值进行计算的所述舍弃值计算部串行配置来进行计算处理。5.根据权利要求1所述的字符识别装置,其特征在于,构成为将对多个舍弃值中独立性较低的舍弃值进行计算的所述舍弃值计算部并行配置来进行计算处理。6.根据权利要求1所述的字符识别装置,其特征在于,构成为将对多个舍弃值中独立性较高的舍弃值进行计算的所述舍弃值计算部串行配置,且将对多个舍弃值中独立性较低的舍弃值进行计算的所述舍弃值计算部并行配置,从而进行计算处理。7.根据权利要求1所述的字符识别装置,其特征在于,所述舍弃函数是以相对于希望舍弃的所述识别结果而取高值、相对于不希望舍弃的所述识别结果而取低值的方式来计算舍弃值的函数。8.根据权利要求1所述的字符识别装置,其特征在于,具有:预先集合了希望舍弃的图像样本的舍弃图像数据库;和预先集合了希望正确读取的图像样本的正读图像数据库,所述字符识别装置以使基于所述正读图像数据库的舍弃率较小、使基于所述舍弃图像数据库的舍弃率较大的方式,决定用于与舍弃值比较来进行舍弃判定的一个或多个阈值。9.根据权利要求1所述的字符识别装置,其特征在于,基于舍弃能力或舍弃率的高低和舍弃值计算成本而得到的舍弃效率越高的所述舍弃值计算部,越在先配置,在所述舍弃判定部基于在先的所述舍弃值计算部所计算出的舍弃值而判定为舍弃的情况下,省略基于在后的所述舍弃值计算部所进行...

【专利技术属性】
技术研发人员:三好利升新庄广永崎健堤庸昂
申请(专利权)人:株式会社日立信息通信工程
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1