帐票处理程序以及帐票处理装置制造方法及图纸

技术编号:2924774 阅读:173 留言:0更新日期:2012-04-11 18:40
自动提取关键字。当输入扫描的帐票图像时,布局识别单元(11)提取帐票图像的读取区域,字符识别单元(13)对该读取区域进行字符识别。在帐票逻辑定义体数据库(14)中存储根据相同种类的帐票中共同的逻辑结构而定义了构成关键字的字符串的帐票逻辑定义体。字符串候选提取单元(15)将字符识别出的字符满足已定义的字符串关系的组合作为字符串候选提取。并且,对应单元(16)将字符串候选根据位置关系进行对应,确定构成关键字的字符串候选的组合。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及帐票处理程序以及帐票处理装置,尤其涉及用于从扫描 的帐票图像中提取规定的关键字的帐票处理的帐票处理程序以及帐票处 理装置。
技术介绍
一直以来,在对纸文件进行电子化的帐票输入业务中有定型帐票输 入和非定型帐票输入两种模式。在定型帐票输入中,在输入的帐票种类已知的情况下的输入方法中, 预先作成记录有输入的帐票的关键字位置等的布局定义体。然后,对扫 描的帐票图像进行形式识别,根据与形式对应的布局定义体来自动提取 关键字。但是,在定型帐票输入中存在当帐票种类未知时则无法应对的 问题。因此,对于作为对象的各个帐票都必须以手动的方式来预先作成 布局定义体,不过这需要花费非常大的成本。另一方面,在非定型帐票输入中,在输入的帐票种类未知的情况下 的输入方法中,无法预先作成布局定义体。因此,必须以手动的方式进 行输入操作,从而使输入成本增大。这样,在定型帐票输入以及非定型帐票输入中都存在问题,为了提 高帐票输入业务的效率,而需要从非定型的帐票中自动提取关键字的方 法。因此,提出了如下的帐票处理装置,艮口识别帐票的图像,根据已 预先设定的关键字检索读取区域并进行提取,并且取得该区域内的识别 数据(例如,参照专利文献l)。另外,还提出了如下的图像处理方法,即为了提高关键字提取的 准确度,而从文件图像中提取与格线等的形状对应的虚拟单元区域,对单元内的图像进行字符识别,根据识别结果来检索与指定关键字对应的字符串,并根据检索出的字符串来确定单元区域(例如,参照专利文献2)。 专利文献l:日本特开平11-238165号公报(段落编号 ,图3)专利文献2:日本特开2001-312691号公报(段落编号 ,图2)一直以来,在从非定型帐票中自动提取关键字时,对帐票图像进行 布局识别以确定读取区域,并进行已确定的读取区域的字符识别,从识 别出的字符串中以单词匹配的方式检索与关键字相当的内容。不过,对 没有布局定义的非定型帐票图像进行正确的布局识别和字符识别是困难 的,时常有失败的可能性。但是,现有的帐票处理,由于在经过布局识 别以及字符识别后提取出的字符串中进行匹配,因此存在当识别不正确 时无法提取关键字这样的问题。举出一例来进行说明。图19是表示由于布局识别失败而无法正确提 取关键字的情况的图。(A)是帐票图像,(B)是表示对(A)的帐票图像进行 了布局识别的文本块的图。在图中的例子中,由于帐票的污渍等,而导致在利用扫描仪来读取 的帐票图像901内产生噪声902。当对该帐票图像901进行布局识别时,由 于在「估计(金额)」和「估计(物名)」之间存在噪声902,所以将这些识别 为1个块,从而误提取了含有噪声的文本块903。由此导致「估计」和「金 额」以及「估计」和「物名」分离。接着,当对该文本块进行字符识别 时,例如,文本块903被字符识别为「估计...和估计」、文本块904被字 符识别为「金额」、文本块905被字符识别为「物名」、文本块906被字 符识别为「Yl20,000」、以及文本块907被字符识别为「个人电脑」。从 而,即使在进行匹配检索的关键字中有「估计金额」或「估计物名」, 也不能从字符识别结果中来进行检测,所以无法提取关键字。这样,当在布局识别中失败时,即使正确地识别出字符也不能正确 地排列字符,所以存在无法提取关键字这样的问题。另外,即使布局识 别正确,但如果字符识别失败则也会产生同样的问题。此外,关键字有项目和数据这2种要素,不过在现有的帐票处理中, 存在有时无法进行项目与数据的正确对应这样的问题。图20是表示了项目和数据难以对应的情况的图。(A)表示有可能两个 项目对应于一个数据的情况,(B)表示有可能两个数据对应于一个项目的情况。在(A)的情况下,进行对帐票图像910的布局识别处理以及字符识别 处理,并取得项目「金额」911、 「合计」915、数据「¥40,000」912、「Y42, 000」913以及「Y82,000」914。根据各个文本块的位置关系, 使垂直方向或水平方向的坐标值大致相等的项目和数据、即视为在垂直 方向或水平方向上排列的项目和数据对应。在此图的例子中,「Y40,000」 912和「Y42,000j 913能够与垂直方向上排列的「金额」911对应。不过,「¥82,000」914能够与垂直方向上排列的「金额」911、和水平方向上排 列的「合计」915中的任一个对应。这样,根据位置关系无法判断哪个为 正确。另一方面,在(B)的情况下,通过对帐票图像920的布局识别处理和 字符识别处理,能够取得项目「发行日」921、 「估计有效期限」923、 数据「2005年12月02日」922以及「2005年12月16日」924。根据各个文 本块的位置关系,能够使「估计有效期限」923和「2005年12月16日」924 对应。不过,水平方向上排列的「2005年12月02日」922和垂直方向上排 列的「2005年12月16日」924中的任一个都能与「发行日」921对应。这 样,根据位置关系无法判断哪个为正确。另外,对于「2005年12月16日」 924,其可以与「发行日」921以及「估计有效期限」923两方构成组。这样,有时难以正确地对应提取出的关键字的项目和数据,在现有 方式中未公开有选择哪个为正确对应的方法。
技术实现思路
本专利技术是鉴于这样的问题而作出的,其目的是提供即使识别结果存 在欠缺或噪声也能够稳定地进行关键字提取的帐票处理程序。另外,本 专利技术的其他目的在于提供可考虑整体匹配性来决定关键字的项目和数据的对应关系的帐票处理装置。本专利技术中为了解决上述课题,而提供用于使计算机执行如图l所示的 处理的帐票处理程序。本专利技术的帐票处理程序适用于帐票处理装置l,可 使计算机执行以下的处理。帐票处理装置l具备布局识别单元ll、字符 识别单元13、字符串候选提取单元15以及对应单元16,并从扫描的帐票图像中提取规定的关键字。布局识别单元ll识别帐票图像的布局,并提取帐票图像中的字符图像的读取区域。字符识别单元13对提取出的读取区域的字符图像进行字符识别,将识别出的字符作为字符识别结果输出。字符串候选提取单元15根据帐票逻辑定义体,从字符识别结果中提取在 帐票逻辑定义体中作为关键字来定义的字符串中所包含的字符,并将提 取出的字符间的关系满足作为构成关键字的字符串的位置关系的组合作 为字符串候选,其中上述帐票逻辑定义体根据相同种类的帐票中共同的 逻辑结构而定义了构成关键字的字符串。对应单元16对于由多个要素组 成的关键字,根据与要素对应的字符串候选在帐票图像上的位置关系来 进行对应,确定构成关键字的字符串候选的组合。根据这样的帐票处理装置l,当输入扫描的帐票图像时,布局识别单 元ll进行帐票图像的布局识别,并提取字符图像的读取区域。字符识别 单元13对提取的读取区域的字符图像进行字符识别并输出字符识别结 果。从而,对布局识别后的字符图像的读取区域进行字符识别,判明在 帐票中所记述的字符。在帐票逻辑定义体数据库14中存储了根据相同种 类的帐票中共同的逻辑结构而定义了构成关键字的字符串的帐票逻辑定 义体。字符串候选提取单元15从字符识别结果中提取在帐票逻辑定义体中作为关键字来定义的字符串中所包含的字符。并且,本文档来自技高网
...

【技术保护点】
一种帐票处理程序,用于从扫描的帐票图像中提取规定的关键字的帐票处理,其特征在于,该帐票处理程序使计算机发挥如下单元的功能: 布局识别单元,其识别上述帐票图像的布局,并提取上述帐票图像中的字符图像的读取区域; 字符识别单元,其对提取出的上述读取区域的字符图像进行字符识别,将识别出的字符作为字符识别结果输出; 字符串候选提取单元,其基于帐票逻辑定义体,从上述字符识别结果中提取在上述帐票逻辑定义体中作为上述关键字来定义的字符串中所包含的字符,并将提取出的字符间的关系满足作为构成上述关键字的字符串的位置关系的组合作为字符串候选,其中上述帐票逻辑定义体根据相同种类的帐票中共同的逻辑结构而定义了构成上述关键字的字符串;以及 对应单元,其针对由多个要素组成的上述关键字,将与上述要素相应的上述字符串候选根据上述帐票图像上的位置关系进行对应,确定构成上述关键字的上述字符串候选的组合。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:武部浩明藤本克仁
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1