获取图像文件中的文本数据的方法、系统、设备和介质技术方案

技术编号:39241976 阅读:15 留言:0更新日期:2023-10-30 11:54
本申请实施例提供一种获取图像文件中的文本数据的方法、系统、设备和介质,以解决现有技术中存在的如何便于对用户指定的图像文件进行OCR识别的问题。该方法包括:基于目标对象获取保单号;其中,目标对象为包含保单号的文档文件,和/或,目标对象为保单查询条件配置结果;基于保单号,从主数据库获取与保单号对应的图像文件,将获取到的图像文件存储至内存数据库;定时调用光学字符识别OCR接口对内存数据库包括的图像文件进行识别,得到识别结果,将识别结果存储至主数据库;从主数据库中获取识别结果,提供给识别结果需求方。提供给识别结果需求方。提供给识别结果需求方。

【技术实现步骤摘要】
获取图像文件中的文本数据的方法、系统、设备和介质


[0001]本申请涉及图像识别
,尤其涉及一种获取图像文件中的文本数据的方法、系统、设备和计算机可读存储介质。

技术介绍

[0002]在开展保险业务时,往往需要使用光学字符识别(Optical Character Recognition,OCR)技术获取图像文件中的文本数据。具体实现方式,可以是通过计算设备调用提供OCR服务的OCR接口,由OCR接口实现对图像文件的OCR识别。
[0003]由于保险业务涉及人身健康、机动车辆等多个领域,因此会需要对大量的诸如身份证扫描件、驾驶证扫描件、发票扫描件等图像文件进行OCR识别以获取其中的文本数据。
[0004]若对大量的图像文件都进行OCR识别,会增加系统的负荷。同时,会导致对不需要进行OCR识别的图像文件也进行了OCR识别,浪费系统的资源。
[0005]对于保险业务而言,OCR识别结果的需求方往往需要基于指定的图像文件的OCR结果进行出单等工作,若对大量的图像文件都进行OCR识别,会大大影响出单等工作的效率。
[0006]如何便于对用户指定的图像文件进行OCR识别,是现有技术亟需解决的技术问题。

技术实现思路

[0007]为解决现有技术中存在的如何便于对用户指定的图像文件进行OCR识别的问题,本申请实施例提供一种获取图像文件中的文本数据的方法、系统、设备和介质。
[0008]本申请实施例之一提供一种获取图像文件中的文本数据的方法,包括:基于目标对象获取保单号;其中,所述目标对象为包含保单号的文档文件,和/或,所述目标对象为保单查询条件配置结果;所述文档文件,是通过第一类页面提供的文档输入入口所输入的;所述保单查询条件配置结果,是基于第二类页面提供的保单查询条件可配置项所配置的;基于所述保单号,从主数据库获取与所述保单号对应的图像文件,将获取到的所述图像文件存储至内存数据库;定时调用光学字符识别OCR接口对所述内存数据库包括的图像文件进行识别,得到识别结果,将所述识别结果存储至所述主数据库;从所述主数据库中获取所述识别结果,提供给识别结果需求方
[0009]本申请实施例之一提供一种获取图像文件中的文本数据的系统,包括:保单号获取模块,用于基于目标对象获取保单号;其中,所述目标对象为包含保单号的文档文件,和/或,所述目标对象为保单查询条件配置结果;所述文档文件,是通过第一类页面提供的文档输入入口所输入的;所述保单查询条件配置结果,是基于第二类页面提供的保单查询条件可配置项所配置的;图像文件获取模块,用于基于所述保单号,从主数据库获取与所述保单号对应的图像文件,将获取到的所述图像文件存储至内存数据库;识别模块,用于定时调用光学字符识别OCR接口对所述内存数据库包括的图像文件进行识别,得到识别结果,将所述识别结果存储至所述主数据库;提供模块,用于从所述主数据库中获取所述识别结果,提供给识别结果需求方。
[0010]本申请实施例之一提供一种电子设备,包括:存储器及处理器,其中,所述存储器,用于存储计算机程序;所述处理器,与所述存储器耦合,用于执行所述存储器中存储的所述计算机程序,以用于执行获取图像文件中的文本数据的方法。
[0011]本申请实施例之一提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现获取图像文件中的文本数据的方法。
[0012]本申请实施例采用的上述至少一个技术方案至少能够达到以下有益效果:
[0013]1、可以灵活地获取保单号,定时调用光学字符识别OCR接口以进行识别,可以便于对用户指定的图像文件进行OCR识别。对于保险业务而言,可以提升出单等工作的效率。
[0014]2、提供自定义配置选项,可以实现按需获取,提升用户体验感,相较于获取全部的与保单号对应的图像文件,提高了获取速度,减轻了系统的负荷。
[0015]3、可以获取图像文件的识别状态,并存储至内存数据库,如此设置,可以便于处理设备仅对未完成识别的图像文件调用光学字符识别OCR接口,减轻了系统的负荷。
附图说明
[0016]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0017]图1是根据本申请一些实施例所示的获取图像文件中的文本数据的系统的应用场景示意图;
[0018]图2是根据本申请一些实施例所示的获取图像文件中的文本数据的系统的示例性示意图;
[0019]图3是根据本申请一些实施例所示的获取图像文件中的文本数据的方法的示例性流程图;
[0020]图4是根据本申请一些实施例所示的第一类页面和第二类页面的示例性示意图;
[0021]图5是根据本申请另一些实施例所示的获取图像文件中的文本数据的方法的示例性流程图。
具体实施方式
[0022]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0023]本领域普通技术人员可知,随着技术的发展和新场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
[0024]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本申请的实施例中对相同属性的对象在描述时所采用的区分方式。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚
地列出的或对于这些过程、方法、产品或设备固有的其它单元。
[0025]为解决现有技术中存在的如何便于对用户指定的图像文件进行OCR识别的问题,本申请实施例提供一种获取图像文件中的文本数据的方法、系统、设备和介质。
[0026]图1是根据本申请一些实施例所示的获取图像文件中的文本数据的系统的应用场景示意图。如图1所示,应用场景100可以包括服务器110、网络120、终端设备130、存储设备140、主数据库150和内存数据库160。服务器110可以包括处理设备(图中未示出)。
[0027]服务器110可以用于管理资源以及处理来自本应用场景至少一个组件或外部数据源(例如,云数据中心)的数据和/或信息。在一些实施例中,服务器110可以是单一服务器或服务器组。在一些实施例中,服务器110可以是区域的或者远程的。在一些实施例中,服务器110可以在云平台上实施,或者以虚拟方式提供。
[0028]处理设备可以用于处理与应用场景100有关的信息和/或数据,例如,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种获取图像文件中的文本数据的方法,其特征在于,包括:基于目标对象获取保单号;其中,所述目标对象为包含保单号的文档文件,和/或,所述目标对象为保单查询条件配置结果;所述文档文件,是通过第一类页面提供的文档输入入口所输入的;所述保单查询条件配置结果,是基于第二类页面提供的保单查询条件可配置项所配置的;基于所述保单号,从主数据库获取与所述保单号对应的图像文件,将获取到的所述图像文件存储至内存数据库;定时调用光学字符识别OCR接口对所述内存数据库包括的图像文件进行识别,得到识别结果,将所述识别结果存储至所述主数据库;从所述主数据库中获取所述识别结果,提供给识别结果需求方。2.根据权利要求1所述的方法,其特征在于,所述第一类页面和第二类页面中,包括针对图像文件内容类别的自定义配置选项;则,基于所述保单号,从主数据库获取与所述保单号对应的图像文件,包括:根据所述保单号和基于所述自定义配置选项所配置的目标图像文件内容类别,从所述主数据库获取与所述保单号和所述目标图像文件内容类别均匹配的图像文件。3.根据权利要求2所述的方法,其特征在于,所述图像文件内容类别,包括下述至少一项:身份证、驾驶证、新车合格证、机动车专用发票、二手车销售统一发票、货物进口证明书、营业执照、户口本。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述OCR接口反馈的用于表征所述图像文件是否完成识别的识别状态;将所述识别状态存储至所述内存数据库。5.一种获取图像文件中的文本数据的系统,其特征在于,包括:保单号获取模块,用于基于目标对象获取保单号;其中,所述目标对象为包含保单号的文档文件,和/或,所述目标对象为保单查询条件配置结果;所述文档文件,是通过第一类页面提供的文档输入入口所输入的;所述保单查询条...

【专利技术属性】
技术研发人员:王磊安然裴旋
申请(专利权)人:中国人民财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1