一种通用的多引擎票据识别系统及方法技术方案

技术编号:21300610 阅读:40 留言:0更新日期:2019-06-12 08:11
本发明专利技术公开了一种通用的多引擎票据识别系统及方法,属于计算机视觉及文字识别领域,要解决的技术问题为如何实现智能财务报销系统票据识别中多引擎接入、提升票据识别效率以及降低人工核验工作量等。技术方案为:①一种通用的多引擎票据识别系统,包括多引擎接入模块、智能服务模块、智能票据识别模块和票据识别API模块。②一种通用的多引擎票据识别方法,步骤如下:S1、通过图像预处理子模块进行图像预处理;S2、通过票据类型识别子模块进行票据类型自动识别;S3、自动选择票据模板;S4、判断是否是多引擎组合识别;S5、将所有单引擎识别的结果复合成多引擎识别结果;S6、基于AI智能服务进行识别结果优化;S7、确信度评估;S8、返回识别结果。

A General Multi-Engine Bill Recognition System and Method

The invention discloses a general multi-engine bill recognition system and method, which belongs to the field of computer vision and character recognition. The technical problems to be solved are how to realize multi-engine access in bill recognition of intelligent financial reimbursement system, improve bill recognition efficiency and reduce manual verification workload, etc. The technical scheme is as follows: 1. A general multi-engine bill recognition system, including multi-engine access module, intelligent service module, intelligent bill recognition module and bill recognition API module. (2) A general multi-engine ticket recognition method, the steps are as follows: S1, image preprocessing by image preprocessing sub-module; S2, automatic ticket type recognition by ticket type recognition sub-module; S3, automatic selection of ticket template; S4, judging whether it is multi-engine combination recognition; S5, combining all single-engine recognition results into multi-engine recognition results; S6, base; In AI intelligent service to optimize the recognition results; S7, confidence evaluation; S8, return the recognition results.

【技术实现步骤摘要】
一种通用的多引擎票据识别系统及方法
本专利技术涉及计算机视觉及文字识别技术,特别涉及基于AI的智能财务报销系统票据识别领域,具体地说是一种通用的多引擎票据识别系统及方法。
技术介绍
近几年票据识别服务发展迅猛,但票据识别率仍相对较低,使得票据识别后还需票据录入人员针对每个识别出的字段进行全面的人工核验以纠正自动识别的错误信息。识别率较低、人工核验过程相对比较耗时,使得票据识别服务的商业化利用率一直较低。如附图1所示,基于AI的智能财务报销系统中,可以借助OCR等技术进行发票的自动识别,以减少报销人员录入工作量、报销审核人员的审核工作量等,提升报销自动化程度和报销效率。长久以来,票据识别引擎没有形成统一的规范,各识别引擎对外提供的服务API区别较大,无法相互兼容。智能财务报销系统交付过程中,客户经常因已购买或其他因素而指定特定的票据识别引擎,这就使得智能财务报销系统疲于应付各种识别引擎的对接,不断的进行客户化定制,很大程度上降低了产品适用度和交付效率,提升了交付成本。因此,解决如何实现智能财务报销系统票据识别中多引擎接入、提升票据识别效率以及降低人工核验工作量是目前亟需解决的问题。专利本文档来自技高网...

【技术保护点】
1.一种通用的多引擎票据识别系统,其特征在于,该系统包括,多引擎接入模块,用于对接入的多个识别引擎进行集中管理,并屏蔽各识别引擎提供的API差异,集中式的调用不同识别引擎进行票据识别;智能服务模块,用于提供机器学习、自然语言处理、企业大数据、票据查验;智能票据识别模块,用于图像预处理、模板管理、票据类型识别、单引擎识别、多引擎组合识别、二维码识别以及确信度评估;票据识别API模块,用于对外提供统一的票据识别API,可在框架层屏蔽不同识别引擎的差异,实现对业务系统无感知的切换不同的票据识别引擎、多引擎组合识别的特性,使得票据识别引擎对上层的业务系统透明。

【技术特征摘要】
1.一种通用的多引擎票据识别系统,其特征在于,该系统包括,多引擎接入模块,用于对接入的多个识别引擎进行集中管理,并屏蔽各识别引擎提供的API差异,集中式的调用不同识别引擎进行票据识别;智能服务模块,用于提供机器学习、自然语言处理、企业大数据、票据查验;智能票据识别模块,用于图像预处理、模板管理、票据类型识别、单引擎识别、多引擎组合识别、二维码识别以及确信度评估;票据识别API模块,用于对外提供统一的票据识别API,可在框架层屏蔽不同识别引擎的差异,实现对业务系统无感知的切换不同的票据识别引擎、多引擎组合识别的特性,使得票据识别引擎对上层的业务系统透明。2.根据权利要求1所述的通用的多引擎票据识别系统,其特征在于,智能服务模块包括机器学习子模块、自然语言处理服务子模块、企业大数据处理子模块和票据查验服务子模块。3.根据权利要求2所述的通用的多引擎票据识别系统,其特征在于,所述机器学习子模块用于基于深度学习算法进行数据解析和不断学习进化,并做出越来越准确的判断和预测;自然语言处理服务子模块用于基于机器学习技术进行语意识别,可结合企业大数据处理模块的功能对识别的错误文字进行矫正、确信度判定;企业大数据处理子模块用于企业大数据的处理,基于企业大数据进行企业名称信息的智能矫正和智能匹配;票据查验服务子模块用于基于发票基本信息到税务总局的电子抵账库中进行发票详细信息获取,校验发票真伪和辅助识别纠正。4.根据权利要求1或2或3所述的通用的多引擎票据识别系统,其特征在于,所述智能票据识别模块包括图像预处理子模块、模板管理子模块、票据类型识别子模块、单引擎识别子模块、多引擎组合识别子模块、二维码识别子模块以及确信度评估子模块。5.根据权利要求4所述的通用的多引擎票据识别系统,其特征在于,所述图像预处理子模块用于对票据图像进行切割、拉正预处理,将粘贴在多张A4纸上的多张发票进行切割、拉正成标准的单张发票;模板管理子模块用于实现票据识别模板的定制和统一管理;票据类型识别子模块用于自动识别经过预处理后的单张...

【专利技术属性】
技术研发人员:戴海宏郑伟波
申请(专利权)人:浪潮通用软件有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1