区域提取程序、字符识别程序以及字符识别装置制造方法及图纸

技术编号:3770806 阅读:213 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及区域提取程序、字符识别程序以及字符识别装置。该区 域提取方法包括以下步骤:获取表示单位区域之间的接续关系的字符点 阵,所述单位区域是通过将图像中的字符串图案分割成被识别为与单个 字符相对应的各个图案而获得的;针对所获取的字符点阵中的各个单位 区域和定义了所述单位区域之间的规则接续关系的规则点阵中的各个单 位区域的全部组合,来判定所述组合是否可能成立;生成连接在与被判 定为可能成立的单元区域的组合相对应的节点之间的路径;基于与所述 规则点阵或者所述字符点阵的一致程度来确定所生成的路径中的最优路 径;以及从图像中提取所述字符点阵中的与所确定的最优路径相对应的 单位区域。

【技术实现步骤摘要】

本专利技术涉及字符识别方法以及用于字符识别的区域提取方法。
技术介绍
在现有技术中,众所周知存在一种OCR (光学字符读取器(Optical Character Reader)),其用于通过扫描仪捕获诸如票据的文件以将所捕获 的文件转换成图像数据,进而将图像数据中的图案识别为字符。在这种 OCR中,会不正确地分离出被提取为与单个字符相对应的图案的区域, 或者会不正确地识别出与各分离出的区域中的图案相对应的字符,因此, 字符识别的结果并非总是可靠的。特别是,当图像数据的质量较差时, 或者当在图像数据中包含由诸如数字字符之类的相似字符构成的词时, 字符识别的准确性趋于下降。例如,在日本特开平11-272804中提出的方法中,在与先前登记在 词典中的词进行比较的同时,对字符识别的结果进行修改,由此提高字 符识别的准确性。具体来说,当将具有层级结构且由多个词构成的词串 (诸如地址)的字符识别的结果与登记在词典中的词进行比较时,通过 考虑层级之间的接续来选择具有最高可靠性的词的组合,并因此将该词 的组合确定为最终识别结果。此外,例如,日本特开2002-312365提出通过考虑字符识别的结果 中的多种可能性来检索最终的识别结果。具体来说,在对包含字符串的 图案进行字符识别之后,对该字符识别的结果进行形态分析,并再次对 被判断为名词或未登记的词的区域进行字符识别。然后将再次获得的字 符识别结果作为候选添加到第一字符识别结果,并从多个候选中检索最 终的识别结果。通常,许多票据包括多个通过固定格式的规则表述来表示的信息,诸如日期和价格。在这些信息中,虽然即使不同票据的该格式相同,但 在各票据中数字字符的数位数会改变,因此字符数也可能不同。因此, 当对诸如票据的文件应用字符识别时,需要包括字符数变化的通配符, 并且同时,需要正确识别由规则表述所表达的信息。然而,当信息中的字符数变化时,即使格式是固定的,也存在难以 执行准确的字符识别的问题。即,当信息中的字符数变化时,除了字符 识别中的错误外,也可能错误地分割对应于单个字符的图案。因此,即 使是通过规则表述来表达信息,在字符识别的准确度的提高方面也存在 固定极限。在上述专利文献中描述的方法中,尽管在词典中登记的词或 者通过再次执行字符识别所获得的结果是识别结果的候选,但也很可能 增加了候选数量。特别是,当字符识别目标的信息例如是日期时,在该 日期中包含许多相似的数字字符,同时识别结果的候选的数量被认为非 常大;因此,需要从大量候选中选择最终识别结果,由此在识别准确度 的提高上产生固定极限。此外,当信息中的字符数变化时,即使在对应于该信息的区域中包 含噪声,也不能有效地去除该噪声。即,当字符数固定时,可在执行字 符识别的同时相对有效地去除字符串图案两端的噪声。然而,当信息中 的字符数变化时,难以区分字符串图案的两端的污迹是噪声还是字符。
技术实现思路
根据本专利技术的各实施方式的一个方面,提供了一种区域提取方法, 该区域提取方法包括以下步骤获取表示单位区域之间的接续关系的字 符点阵,所述单位区域是通过将图像中的字符串图案分割成被识别为与单个字符相对应的各个图案而获得的;针对所获取的字符点阵中的各个单位区域与定义了所述单位区域之间的规则接续关系的规则点阵中的各个单位区域的全部组合,来判定所述组合是否可能成立;生成连接在与 被判定为可能成立的单元区域的组合相对应的节点之间的路径;基于与 所述规则点阵或者所述字符点阵的一致程度来从所生成的路径中确定最 优路径;以及从图像中提取字符点阵中的与所确定的最优路径相对应的单位区域。本专利技术的各实施方式提供了一种字符识别装置,该字符识别装置包 括获取部,其获取表示单位区域之间的接续关系的字符点阵,所述单 位区域是通过将图像中的字符串图案分割成被识别为与单个字符相对应 的各个图案而获得的;判定部,其针对由所述获取部获取的所述字符点 阵中的各个单位区域与定义了所述单位区域之间的规则接续关系的规则点阵中的各个单位区域的全部组合,来判定所述组合是否可能成立;生成部,其生成连接在与被所述判定部判定为可能成立的单元区域的组合相对应的节点之间的路径;确定部,其基于与所述规则点阵或者所述字 符点阵的一致程度来确定由所述生成部生成的路径中的最优路径;提取 部,其从图像中提取字符点阵中的与所述确定部确定的最优路径相对应 的单位区域;以及识别部,其利用只包含所述规则点阵中的单位区域所 属的类目中的字符的类目词典对所述提取部提取的单位区域中的图案应 用字符识别。附图说明图1是示出根据一实施方式的字符识别装置的相关部件的构成的框图2是示出根据一实施方式的规则点阵的示例的图3是示出根据一实施方式的预处理结果的示例的图4是示出根据一实施方式的字符点阵的示例的图5是示出根据一实施方式的对应关系表的示例的图6是示出根据一实施方式的最优路径的示例的图7是示出根据一实施方式的目标区域的示例的图8是示出根据一实施方式的字符识别装置的操作的流程图9是示出根据一实施方式的对应关系表生成处理的流程图IO是示出根据一实施方式的路径生成处理的流程图11是示出根据一实施方式的节点的连接的示例的图12是示出根据一实施方式的节点的连接的另一示例的图;图13是示出根据一实施方式的节点的连接的又一示例的图;以及 图14是示出根据一实施方式的字符识别结果的示例的图。具体实施例方式稍后将描述的本实施方式的本质特征是针对字符点阵中的单位区域 (其中,以点阵形式表达作为字符识别目标的字符串区域)和规则点阵 中的单位区域(其中,以点阵形式来表述定义了信息格式的规则表述) 的各组合来计算可靠性,并因此确定连接与具有高可靠性的组合相对应 的节点的路径中的最优路径,由此提取与该最优路径相对应并将经历字 符识别的区域。此后,参照附图详细描述本专利技术的一实施方式。图1是示出根据一实施方式的字符识别装置100的相关部件的构成 的框图。该字符识别装置100具有预处理部101、字符词典存储部102、 规则点阵存储部103、类目词典存储部104、目标字符串提取部105、字 符串区域放大部106、字符点阵生成部107、识别可靠性计算部108、路 径生成部109、最优路径确定部IOO、目标区域提取部lll以及类目识别 部112。预处理部101对包括由规则表述所表达的信息(例如日期)图案的 票据应用字符识别(其中,利用了字符词典存储部102中存储的字符词 典),并获得由该票据的整个图像的字符串图案所表达的字符串。字符词典存储部102存储有包括了票据图像中能够包含的全部字符 的字符词典。即,在普通字符识别中,词典存储部102存储用于与图像 中的图案进行比较的字符词典。规则点阵存储部103存储有定义了票据中的规则表述的规则点阵。 即,规则点阵存储部103存储了由规则表述所表达的信息中的单位区域 的单个字符和定义了所述单位区域之间的接续关系的规则点阵。具体来说,规则点阵存储部103,例如图2中所示,存储了日期中 的单位区域el到ell的单个字符和这些单位区域之间的接续关系。此后, 利用图2的规则点阵作为一个主要示例进行描述。在图2所示的示例中,单位区域el到e4分别对应于表示年份的数字字符,而单位区域e5对应于字符"年(year)"。单本文档来自技高网
...

【技术保护点】
一种计算机可读记录介质,在该计算机可读记录介质中记录了执行区域提取方法的程序,该程序在被计算机执行时使得所述计算机执行所述方法,所述方法包括以下步骤: 获取步骤,其获取表示单位区域之间的接续关系的字符点阵,所述单位区域是通过将图像中的 字符串图案分割成被识别为与单个字符相对应的各个图案而获得的; 判定步骤,其针对在所述获取步骤中获取的所述字符点阵中的各个单位区域和定义了所述单位区域之间的规则接续关系的规则点阵中的各个单位区域的全部组合,来判定所述组合是否可能成立;   生成步骤,其生成连接在与所述判定步骤中被判定为可能成立的单元区域的组合相对应的节点之间的路径; 确定步骤,其基于与所述规则点阵或者所述字符点阵的一致程度来确定在所述生成步骤中生成的路径中的最优路径;以及 提取步骤,其从图像 中提取所述字符点阵中的与在所述确定步骤中确定的所述最优路径相对应的单位区域。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:武部浩明藤本克仁
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1