【技术实现步骤摘要】
票证识别装置以及票证信息管理系统
本专利技术涉及一种票证识别装置以及票证信息管理系统。
技术介绍
企业机构中,当对发票等票证进行信息统计管理时,需要先将票证中的数据录入至计算机中。而在传统的票证录入方式中,往往需要相应人员手工核查票证中的内容,并将内容输入至计算机,这种录入方式非常容易出错,并且缺乏效率。为了便于票证信息的录入,也有一些软件采用了光学字符识别(OpticalCharacterRecognition,OCR)技术,能够根据票证的图像将图像中全部的文字转换为文本格式,使得相应人员可以方便地从识别出的字符中拷贝所需内容,并录入至计算机中完成票证内容的整理。然而,在票证数量较大时,这种方式的工作效率仍然不高,依旧需要相应人员对识别出的字符进行核查,并重复复制和粘贴的操作。同时,在采用OCR识别技术对票证的整体进行识别时,若在票证中出现一些不常用的字体、文字、装饰等影响识别的内容时,OCR识别技术就会产生识别错误并需要人为纠正,更进一步地降低了相应人员在票证识别上的工作效率。
技术实现思路
为解决上述问题,提供一种能够通过特定OCR对票证中的特定内容进行特定识别的票证识别装置以及票证信息管理系统,本专利技术采用了如下技术方案:<结构一>本专利技术提供了一种票证识别装置,用于对预定的多种票证上所记载的内容进行识别,其特征在于,包括:模板存储部、票证图像获取部、OCR控制部、通用OCR识别部、模板匹配部、特定区域获取部以及至少一个特定OCR识别部,其中 ...
【技术保护点】
1.一种票证识别装置,用于对预定的多种票证上所记载的内容进行识别,其特征在于,包括:/n模板存储部、票证图像获取部、OCR控制部、通用OCR识别部、模板匹配部、特定区域获取部以及至少一个特定OCR识别部,/n其中,所述模板存储部存储有与每一种所述票证的票证模板相对应的票证模板数据,该票证模板数据包含票证识别名称、多个票证识别用关键词和每一个票证识别用关键词在相应票证中的关键词位置信息、以及与所述票证中至少一个需要所述特定OCR识别部进行识别的特定区域相对应的特定区域位置信息和与所述特定区域相对应的条目名称,/n所述票证图像获取部获取与待识别票证相对应的待识别票证图像,/n所述OCR控制部控制所述通用OCR识别部对所述待识别票证图像进行初步识别从而识别出该待识别票证图像中的所有字符以及每个字符的字符位置信息,/n所述模板匹配部基于初步识别出的所述字符和所述字符位置信息以及所述模板存储部中与每一种所述票证模板相对应的所述票证识别用关键词和所述关键词位置信息匹配出对应于所述待识别票证的票证模板数据作为当前票证模板数据,/n所述特定区域获取部基于所述当前票证模板数据中的所述特定区域位置信息从所 ...
【技术特征摘要】
1.一种票证识别装置,用于对预定的多种票证上所记载的内容进行识别,其特征在于,包括:
模板存储部、票证图像获取部、OCR控制部、通用OCR识别部、模板匹配部、特定区域获取部以及至少一个特定OCR识别部,
其中,所述模板存储部存储有与每一种所述票证的票证模板相对应的票证模板数据,该票证模板数据包含票证识别名称、多个票证识别用关键词和每一个票证识别用关键词在相应票证中的关键词位置信息、以及与所述票证中至少一个需要所述特定OCR识别部进行识别的特定区域相对应的特定区域位置信息和与所述特定区域相对应的条目名称,
所述票证图像获取部获取与待识别票证相对应的待识别票证图像,
所述OCR控制部控制所述通用OCR识别部对所述待识别票证图像进行初步识别从而识别出该待识别票证图像中的所有字符以及每个字符的字符位置信息,
所述模板匹配部基于初步识别出的所述字符和所述字符位置信息以及所述模板存储部中与每一种所述票证模板相对应的所述票证识别用关键词和所述关键词位置信息匹配出对应于所述待识别票证的票证模板数据作为当前票证模板数据,
所述特定区域获取部基于所述当前票证模板数据中的所述特定区域位置信息从所述待识别票证图像中获取相对应的特定区域,
一旦所述特定区域被获取,所述OCR控制部就控制所述特定OCR识别部对该特定区域中的字符进行特定识别从而识别出相应的特定内容。
2.根据权利要求1所述的票证识别装置,其特征在于,还包括:
画面存储部以及输入显示部,
其中,所述画面存储部存储有模板图像输入画面以及模板数据输入画面,
所述输入显示部显示所述模板图像画面让所述用户输入用于作为模板的票证模板图像以及模板的票证识别名称,
一旦所述用户确认所述票证模板图像以及所述票证识别名称的输入,所述输入显示部就显示所述模板数据输入画面让所述用户输入票证模板数据,
所述模板数据输入画面包括用于让所述用户从所述票证模板图像中框选多个关键词位置区域的关键词位置框选部分、用于让所述用户从所述票证模板图像中框选至少一个特定区域并指定与该特定区域相对应的条目名称的特定区域设定部分以及用于让所述用户确认所述票证模板的创建的模板创建确认部分,
每当所述用户确认框选一个所述关键词位置区域,所述OCR控制部就控制所述通用OCR识别部在所述票据模板图像中对所述关键词位置区域中的字符以及相应的字符位置信息进行识别并将识别出的字符作为所述票证识别用关键词以及将相应的字符位置信息作为相应的所述关键词位置信息,
一旦所述用户确认所述票证模板的创建,所述模板存储部就将所述票证识别名称、所述票证识别用关键词和相应的所述关键词位置信息、所述特定区域位置信息和对应的所述条目名称作为一条新的票证模板数据进行对应存储。
3.根据权利要求1所述的票证识别装置,其特征在于:
其中,所述模板匹配部包括:
候选模板匹配单元,基于预定的关键词匹配规则将由所述初步识别出的所述所有字符组成的待匹配字符串分别与每一种所述票证模板的所述票证识别用关键词进行关键词匹配并将匹配出的所述票证模板作为候选模板;
待匹配关键词获取单元,依次根据每一种所述候选模板的所述票证识别用关键词从所述待匹配字符串中获取对应的所述字符作为待匹配关键词,并获取相应...
【专利技术属性】
技术研发人员:曹永刚,顾炯,戴正军,
申请(专利权)人:理光图像技术上海有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。