一种基于OCR的多引擎自定义切换方法、设备及介质技术

技术编号:33154684 阅读:10 留言:0更新日期:2022-04-22 14:10
本申请公开了一种基于OCR的多引擎自定义切换方法、设备及介质,方法包括:确定不同来源的多个OCR识别引擎,将多个OCR识别引擎的识别文件上传至API服务器,以通过API服务器集成多个OCR识别引擎;通过API服务器确定OCR识别引擎的配置文件,并根据配置文件通过API服务器的API接口与OCR识别引擎进行连接;通过API服务器确定环境变量,并根据环境变量对OCR识别引擎进行容器化部署,以为用户提供OCR识别引擎的切换服务。构建了一个可集成多家OCR服务识别厂商的OCR服务网关,在容器化部署服务时,可根据业务需要,完成不停服务的情况下切换其它厂商的OCR识别引擎服务。它厂商的OCR识别引擎服务。它厂商的OCR识别引擎服务。

【技术实现步骤摘要】
一种基于OCR的多引擎自定义切换方法、设备及介质


[0001]本申请涉及计算机
,尤其涉及一种基于OCR的多引擎自定义切换方法、设备及介质。

技术介绍

[0002]光学字符识别(Optical Character Recognition,OCR)是指电子设备检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。
[0003]应用程序接口(Application Programming Interface,API)是一种预先定义的接口,或指软件系统不同组成部分衔接的约定。API用来提供应用程序与开发人员基于某软件或硬件得以访问的一组例程,而又无需访问源码,或理解内部工作机制的细节。如今很多人使用API时,常常通过网络分享应用数据HTTP API,能够从多个应用程序中混搭数据到混合应用程序中,或是创建一个能增强使用他人应用体验的应用程序。REST(Representational State Transfer,表现层状态转移)是用来描述创建HTTP API的标准方法,其中的四种常用的行为,查看(view)、创建(create)、编辑(edit)和删除(delete)都可以直接映射到HTTP中已实现的GET、POST、PUT和DELETE方法。目前HTTP是唯一与REST相关的示例,因此REST也是通过HTTP实现的REST。
[0004]目前市面上的开源网关管理软件无法根据具体业务实现对OCR网关的HTTP REST API不同底层接口的可配置自由切换,且无法在不切换API地址、不停服务的情况下来根据业务需要切换不同的内部底层接口。
[0005]因此,如何弥补开源网关软件在OCR底层切换方面的不足,成为当下亟待解决的问题。

技术实现思路

[0006]为了解决上述问题,本申请提出了一种基于OCR的多引擎自定义切换方法,包括:确定不同来源的多个OCR识别引擎,将多个所述OCR识别引擎的识别文件上传至API服务器,以通过所述API服务器集成所述多个OCR识别引擎;通过所述API服务器确定所述OCR识别引擎的配置文件,并根据所述配置文件通过所述API服务器的API接口与所述OCR识别引擎进行连接;通过所述API服务器确定环境变量,并根据所述环境变量对所述OCR识别引擎进行容器化部署,以为用户提供所述OCR识别引擎的切换服务。
[0007]在一个示例中,根据所述环境变量对所述OCR识别引擎进行容器化部署,具体包括:根据所述配置文件确定所述OCR识别引擎的配置环境,将所述环境变量与所述多个OCR识别引擎对应的多个所述配置环境进行比对,以根据所述环境变量在所述多个OCR识别引擎中确定对应的待部署识别引擎;通过所述API接口将已连接的所述OCR识别引擎断开连
接,并与所述待部署识别引擎进行重新连接,以完成容器化部署。
[0008]在一个示例中,根据所述环境变量对所述OCR识别引擎进行容器化部署之前,所述方法还包括:通过所述API服务器采集所述OCR识别引擎的运行情况,所述运行情况包括识别领域、识别速度、识别效果中的至少一种;对所述OCR识别引擎的所述运行情况进行分析,得到所述多个OCR识别引擎中的最佳识别引擎,并根据所述最佳识别引擎确定对应的所述环境变量,以通过所述API服务器对所述最佳识别引擎进行容器化部署。
[0009]在一个示例中,根据所述环境变量对所述OCR识别引擎进行容器化部署之前,所述方法还包括:通过所述API服务器采集所述用户的反馈信息,根据所述反馈信息分析所述OCR识别引擎的所述配置文件,得到所述反馈信息对应的配置问题;根据所述配置问题在其他OCR识别引擎中确定替换识别引擎,并根据所述替换识别引擎确定对应的所述环境变量,以通过所述API服务器对所述替换识别引擎进行容器化部署。
[0010]在一个示例中,所述方法还包括:通过所述API服务器采集所述用户的服务请求,将所述服务请求与已集成的所述多个OCR识别引擎的所述多个配置文件进行匹配;若所述多个配置文件与所述服务请求匹配失败,则通过所述API服务器将所述服务请求发送至第三方API服务器。
[0011]在一个示例中,所述方法还包括:接收所述用户通过第三方API服务器发送的第三方服务请求;根据所述第三方服务请求确定对应的所述OCR识别引擎的所述配置文件,并根据所述配置文件通过所述API服务器的API接口与所述OCR识别引擎进行连接。
[0012]在一个示例中,所述方法还包括:通过所述API服务器获取所述OCR识别引擎的升级请求,并根据所述OCR识别引擎的所述配置文件在其他OCR识别引擎中确定替换识别引擎;根据所述升级请求对所述OCR识别引擎进行升级。
[0013]在一个示例中,根据所述升级请求对所述OCR识别引擎进行升级,具体包括:根据所述升级请求对所述OCR识别引擎的版本进行滚动升级,并对所述滚动升级进行升级检测;若所述滚动升级出现故障,将所述OCR识别引擎回退到上一个版本。
[0014]另一方面,本申请还提出了一种基于OCR的多引擎自定义切换设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述一种基于OCR的多引擎自定义切换设备能够执行:如上述任意一个示例所述的方法。
[0015]另一方面,本申请还提出了一种非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:如上述任意一个示例所述的方法。
[0016]本申请以Java中的抽象接口可以多个实现方法的方式为基础,构建了一个可集成多家OCR服务识别厂商的OCR服务网关,同一个地址的HTTP REST API可通过配置文件中的具体配置选择具体厂商的OCR识别引擎服务,在容器化部署服务时,可根据业务需要,完成不停服务的情况下切换其它厂商的OCR识别引擎服务。
附图说明
[0017]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0018]图1为本申请实施例中一种基于OCR的多引擎自定义切换方法的流程示意图;
[0019]图2为本申请实施例中一种基于OCR的多引擎自定义切换设备的示意图。
具体实施方式
[0020]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0021]以下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于OCR的多引擎自定义切换方法,其特征在于,包括:确定不同来源的多个OCR识别引擎,将多个所述OCR识别引擎的识别文件上传至API服务器,以通过所述API服务器集成所述多个OCR识别引擎;通过所述API服务器确定所述OCR识别引擎的配置文件,并根据所述配置文件通过所述API服务器的API接口与所述OCR识别引擎进行连接;通过所述API服务器确定环境变量,并根据所述环境变量对所述OCR识别引擎进行容器化部署,以为用户提供所述OCR识别引擎的切换服务。2.根据权利要求1所述的方法,其特征在于,根据所述环境变量对所述OCR识别引擎进行容器化部署,具体包括:根据所述配置文件确定所述OCR识别引擎的配置环境,将所述环境变量与所述多个OCR识别引擎对应的多个所述配置环境进行比对,以根据所述环境变量在所述多个OCR识别引擎中确定对应的待部署识别引擎;通过所述API接口将已连接的所述OCR识别引擎断开连接,并与所述待部署识别引擎进行重新连接,以完成容器化部署。3.根据权利要求1所述的方法,其特征在于,根据所述环境变量对所述OCR识别引擎进行容器化部署之前,所述方法还包括:通过所述API服务器采集所述OCR识别引擎的运行情况,所述运行情况包括识别领域、识别速度、识别效果中的至少一种;对所述OCR识别引擎的所述运行情况进行分析,得到所述多个OCR识别引擎中的最佳识别引擎,并根据所述最佳识别引擎确定对应的所述环境变量,以通过所述API服务器对所述最佳识别引擎进行容器化部署。4.根据权利要求1所述的方法,其特征在于,根据所述环境变量对所述OCR识别引擎进行容器化部署之前,所述方法还包括:通过所述API服务器采集所述用户的反馈信息,根据所述反馈信息分析所述OCR识别引擎的所述配置文件,得到所述反馈信息对应的配置问题;根据所述配置问题在其他OCR识别引擎中确定替换识别引擎,并根据所述替换识别引擎确定对应的所述环境...

【专利技术属性】
技术研发人员:杨修光
申请(专利权)人:山东浪潮通软信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1