票证识别装置以及票证信息管理系统制造方法及图纸

技术编号:26172701 阅读:55 留言:0更新日期:2020-10-31 13:51
本发明专利技术提供一种票证识别装置以及票证信息管理系统,用于对预定的多种票证上所记载的内容进行识别并对识别出的内容进行管理,其特征在于,票证识别装置包括:模板存储部、OCR控制部、通用OCR识别部、模板匹配部以及至少一个特定OCR识别部,其中,模板存储部存储有与每一种票证的票证模板相对应的票证模板数据,该票证模板数据包含与票证中需要特定OCR识别部进行识别的特定区域相对应的特定区域位置信息,OCR控制部控制通用OCR识别部对待识别票证图像进行初步识别,模板匹配部基于初步识别出的结果匹配出对应于待识别票证的票证模板数据作为当前票证模板数据,OCR控制部控制特定OCR识别部对特定区域中的字符进行特定识别从而识别出相应的特定内容。

【技术实现步骤摘要】
票证识别装置以及票证信息管理系统
本专利技术涉及一种票证识别装置以及票证信息管理系统。
技术介绍
企业机构中,当对发票等票证进行信息统计管理时,需要先将票证中的数据录入至计算机中。而在传统的票证录入方式中,往往需要相应人员手工核查票证中的内容,并将内容输入至计算机,这种录入方式非常容易出错,并且缺乏效率。为了便于票证信息的录入,也有一些软件采用了光学字符识别(OpticalCharacterRecognition,OCR)技术,能够根据票证的图像将图像中全部的文字转换为文本格式,使得相应人员可以方便地从识别出的字符中拷贝所需内容,并录入至计算机中完成票证内容的整理。然而,在票证数量较大时,这种方式的工作效率仍然不高,依旧需要相应人员对识别出的字符进行核查,并重复复制和粘贴的操作。同时,在采用OCR识别技术对票证的整体进行识别时,若在票证中出现一些不常用的字体、文字、装饰等影响识别的内容时,OCR识别技术就会产生识别错误并需要人为纠正,更进一步地降低了相应人员在票证识别上的工作效率。
技术实现思路
为解决上述问题,提供一种能够通过特定OCR对票证中的特定内容进行特定识别的票证识别装置以及票证信息管理系统,本专利技术采用了如下技术方案:<结构一>本专利技术提供了一种票证识别装置,用于对预定的多种票证上所记载的内容进行识别,其特征在于,包括:模板存储部、票证图像获取部、OCR控制部、通用OCR识别部、模板匹配部、特定区域获取部以及至少一个特定OCR识别部,其中,模板存储部存储有与每一种票证的票证模板相对应的票证模板数据,该票证模板数据包含票证识别名称、多个票证识别用关键词和每一个票证识别用关键词在相应票证中的关键词位置信息、以及与票证中至少一个需要特定OCR识别部进行识别的特定区域相对应的特定区域位置信息和与特定区域相对应的条目名称,票证图像获取部获取与待识别票证相对应的待识别票证图像,OCR控制部控制通用OCR识别部对待识别票证图像进行初步识别从而识别出该待识别票证图像中的所有字符以及每个字符的字符位置信息,模板匹配部基于初步识别出的字符和字符位置信息以及模板存储部中与每一种票证模板相对应的票证识别用关键词以及关键词位置信息匹配出对应于待识别票证的票证模板数据作为当前票证模板数据,特定区域获取部基于当前票证模板数据中的特定区域位置信息从待识别票证图像中获取相对应的特定区域,一旦特定区域被获取,OCR控制部就控制特定OCR识别部对该特定区域中的字符进行特定识别从而识别出相应的特定内容。<结构二>本专利技术提供了一种票证信息管理系统,其特征在于,包括:票证识别装置,用于对预定的多种票证上所记载的内容进行识别;以及票证信息管理装置,与票证识别装置相通信连接,其中,票证识别装置为结构一中的票证识别装置,票证信息管理装置至少对来自于票证识别装置的票证识别名称、特定内容以及相对应的条目名称进行管理。专利技术作用与效果根据本专利技术的票证识别装置以及票证信息管理系统,由于预先存储有对应各种类票证的票证模板数据,该票证模板数据中含有多个票证识别用关键词以及关键词位置信息,并且在获取到待识别票证图像后,通过通用OCR识别部识别出待识别票证图像中所有字符以及字符位置信息,因此,模板匹配部可以准确地匹配出与待识别票证图像的票证种类相对应的票证模板数据。还由于票证模板数据中还含有与票证中只能通过特定OCR识别部进行识别的特定区域相对应的特定区域位置信息,因此在匹配出票证模板数据后,特定OCR识别部可以对待识别票证图像中的特定区域进行特定识别,并准确地识别出相应的特定内容。通过这样的方式,可以在票证中存在特殊字体、特殊格式、非常用语言等通用OCR识别部难以识别的内容时,通过特定OCR识别部准确地完成识别。进一步地,由于票证模板数据中含有与特定区域相对应的条目名称,因此在特定内容被识别后还匹配有对应条目名称,使得本专利技术的票证识别装置最终输出了结构化的数据,方便后续针对票证中内容的进行统计以及管理。附图说明图1是本专利技术实施例中票证信息管理系统的结构框图;图2是本专利技术实施例中模板存储部所存储的票证模板数据的示意图;图3是本专利技术实施例中模板匹配部的结构框图;图4是本专利技术实施例中相似度计算规则的流程图;图5是本专利技术实施例中距离记录字符串的示意图;图6是本专利技术实施例中特定区域的示意图;图7是本专利技术实施例中模板数据输入画面的示意图;图8是本专利技术实施例中票证识别过程的流程图;以及图9是本专利技术实施例中票证模板匹配过程的流程图。具体实施方式为了使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,以下结合实施例及附图对本专利技术的票证识别装置以及票证信息管理系统作具体阐述。作为一种实施形态,本专利技术提供了一种票证识别装置,用于对预定的多种票证上所记载的内容进行识别,其特征在于,包括:模板存储部、票证图像获取部、OCR控制部、通用OCR识别部、模板匹配部、特定区域获取部以及至少一个特定OCR识别部,其中,模板存储部存储有与每一种票证的票证模板相对应的票证模板数据,该票证模板数据包含票证识别名称、多个票证识别用关键词和每一个票证识别用关键词在相应票证中的关键词位置信息、以及与票证中至少一个需要特定OCR识别部进行识别的特定区域相对应的特定区域位置信息和与特定区域相对应的条目名称,票证图像获取部获取与待识别票证相对应的待识别票证图像,OCR控制部控制通用OCR识别部对待识别票证图像进行初步识别从而识别出该待识别票证图像中的所有字符以及每个字符的字符位置信息,模板匹配部基于初步识别出的字符和字符位置信息以及模板存储部中与每一种票证模板相对应的票证识别用关键词以及关键词位置信息匹配出对应于待识别票证的票证模板数据作为当前票证模板数据,特定区域获取部基于当前票证模板数据中的特定区域位置信息从待识别票证图像中获取相对应的特定区域,一旦特定区域被获取,OCR控制部就控制特定OCR识别部对该特定区域中的字符进行特定识别从而识别出相应的特定内容。在第一种实施形态中,还可以具有这样的技术特征,还包括:画面存储部以及输入显示部,其中,画面存储部存储有模板图像输入画面以及模板数据输入画面,输入显示部显示模板图像画面让用户输入用于作为模板的票证模板图像以及模板的票证识别名称,一旦用户确认票证模板图像以及票证识别名称的输入,输入显示部就显示模板数据输入画面让用户输入票证模板数据,模板数据输入画面包括用于让用户从票证模板图像中框选多个关键词位置区域的关键词位置框选部分、用于让用户从票证模板图像中框选至少一个特定区域并指定与该特定区域相对应的条目名称的特定区域设定部分以及用于让用户确认票证模板的创建的模板创建确认部分,每当用户确认框选一个关键词位置区域,OCR控制部就控制通用OCR识别部在票据模板图像中对关键词位置区域中的字符以及相应的字符位置信息进行识别并将识别出的字符作为票证识别用关键词以及将相应的字符位置信息作为相本文档来自技高网...

【技术保护点】
1.一种票证识别装置,用于对预定的多种票证上所记载的内容进行识别,其特征在于,包括:/n模板存储部、票证图像获取部、OCR控制部、通用OCR识别部、模板匹配部、特定区域获取部以及至少一个特定OCR识别部,/n其中,所述模板存储部存储有与每一种所述票证的票证模板相对应的票证模板数据,该票证模板数据包含票证识别名称、多个票证识别用关键词和每一个票证识别用关键词在相应票证中的关键词位置信息、以及与所述票证中至少一个需要所述特定OCR识别部进行识别的特定区域相对应的特定区域位置信息和与所述特定区域相对应的条目名称,/n所述票证图像获取部获取与待识别票证相对应的待识别票证图像,/n所述OCR控制部控制所述通用OCR识别部对所述待识别票证图像进行初步识别从而识别出该待识别票证图像中的所有字符以及每个字符的字符位置信息,/n所述模板匹配部基于初步识别出的所述字符和所述字符位置信息以及所述模板存储部中与每一种所述票证模板相对应的所述票证识别用关键词和所述关键词位置信息匹配出对应于所述待识别票证的票证模板数据作为当前票证模板数据,/n所述特定区域获取部基于所述当前票证模板数据中的所述特定区域位置信息从所述待识别票证图像中获取相对应的特定区域,/n一旦所述特定区域被获取,所述OCR控制部就控制所述特定OCR识别部对该特定区域中的字符进行特定识别从而识别出相应的特定内容。/n...

【技术特征摘要】
1.一种票证识别装置,用于对预定的多种票证上所记载的内容进行识别,其特征在于,包括:
模板存储部、票证图像获取部、OCR控制部、通用OCR识别部、模板匹配部、特定区域获取部以及至少一个特定OCR识别部,
其中,所述模板存储部存储有与每一种所述票证的票证模板相对应的票证模板数据,该票证模板数据包含票证识别名称、多个票证识别用关键词和每一个票证识别用关键词在相应票证中的关键词位置信息、以及与所述票证中至少一个需要所述特定OCR识别部进行识别的特定区域相对应的特定区域位置信息和与所述特定区域相对应的条目名称,
所述票证图像获取部获取与待识别票证相对应的待识别票证图像,
所述OCR控制部控制所述通用OCR识别部对所述待识别票证图像进行初步识别从而识别出该待识别票证图像中的所有字符以及每个字符的字符位置信息,
所述模板匹配部基于初步识别出的所述字符和所述字符位置信息以及所述模板存储部中与每一种所述票证模板相对应的所述票证识别用关键词和所述关键词位置信息匹配出对应于所述待识别票证的票证模板数据作为当前票证模板数据,
所述特定区域获取部基于所述当前票证模板数据中的所述特定区域位置信息从所述待识别票证图像中获取相对应的特定区域,
一旦所述特定区域被获取,所述OCR控制部就控制所述特定OCR识别部对该特定区域中的字符进行特定识别从而识别出相应的特定内容。


2.根据权利要求1所述的票证识别装置,其特征在于,还包括:
画面存储部以及输入显示部,
其中,所述画面存储部存储有模板图像输入画面以及模板数据输入画面,
所述输入显示部显示所述模板图像画面让所述用户输入用于作为模板的票证模板图像以及模板的票证识别名称,
一旦所述用户确认所述票证模板图像以及所述票证识别名称的输入,所述输入显示部就显示所述模板数据输入画面让所述用户输入票证模板数据,
所述模板数据输入画面包括用于让所述用户从所述票证模板图像中框选多个关键词位置区域的关键词位置框选部分、用于让所述用户从所述票证模板图像中框选至少一个特定区域并指定与该特定区域相对应的条目名称的特定区域设定部分以及用于让所述用户确认所述票证模板的创建的模板创建确认部分,
每当所述用户确认框选一个所述关键词位置区域,所述OCR控制部就控制所述通用OCR识别部在所述票据模板图像中对所述关键词位置区域中的字符以及相应的字符位置信息进行识别并将识别出的字符作为所述票证识别用关键词以及将相应的字符位置信息作为相应的所述关键词位置信息,
一旦所述用户确认所述票证模板的创建,所述模板存储部就将所述票证识别名称、所述票证识别用关键词和相应的所述关键词位置信息、所述特定区域位置信息和对应的所述条目名称作为一条新的票证模板数据进行对应存储。


3.根据权利要求1所述的票证识别装置,其特征在于:
其中,所述模板匹配部包括:
候选模板匹配单元,基于预定的关键词匹配规则将由所述初步识别出的所述所有字符组成的待匹配字符串分别与每一种所述票证模板的所述票证识别用关键词进行关键词匹配并将匹配出的所述票证模板作为候选模板;
待匹配关键词获取单元,依次根据每一种所述候选模板的所述票证识别用关键词从所述待匹配字符串中获取对应的所述字符作为待匹配关键词,并获取相应...

【专利技术属性】
技术研发人员:曹永刚顾炯戴正军
申请(专利权)人:理光图像技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1