征信报告识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:17796897 阅读:15 留言:0更新日期:2018-04-25 20:24
本发明专利技术涉及一种征信报告识别方法、装置、计算机设备及存储介质,包括:获取征信报告,征信报告为含有信用信息的影印资料,征信报告携带有唯一标识,采用OCR技术识别征信报告以将影印资料转换为文本信息,将文本信息作为识别结果输出,检测识别结果的准确率,当识别结果的准确率符合预设条件时,输出识别结果。由于使用了OCR技术,在对征信报告进行查看和审核的时候,只需要终端自动进行操作,不需要耗费大量的人力和物力,而且,通过终端自动进行操作结果比较精确,不易泄露征信报告中的信息。

Credit report recognition method, device, computer equipment and storage medium

The invention relates to a method, device, computer equipment and storage medium of the letter reporting, including: obtaining the letter report, the letter report is the photocopy of the credit information, the letter report carries the unique identity, the OCR technology is used to identify the letter of the letter to convert the photocopies to text information and the text information. As the output of the recognition result, the accuracy of the recognition result is detected. When the accuracy of the recognition result meets the preset condition, the recognition result is output. Because of the use of OCR technology, when checking and reviewing the report of the letter, only the terminal is required to operate automatically. It does not require a lot of manpower and material resources. Moreover, the result of automatic operation through terminal is more accurate, and it is not easy to disclose information in the report.

【技术实现步骤摘要】
征信报告识别方法、装置、计算机设备及存储介质
本专利技术涉及数据处理领域,特别是涉及一种征信报告识别方法、装置、计算机设备及存储介质。
技术介绍
征信报告是金融行业信用评估的主要信息来源和依据。在传统技术中,对征信报告中信息的利用主要是通过人工查看和审核,由于每份征信报告含有的信息不同,在人工查看和审核时,通常需要逐份查看并对征信报告进行分类,再将审核结果一一入库。传统技术的这种对征信报告的处理方式比较复杂,需要耗费大量的人力、物力、财力。并且,通过人工查看审核的结果往往不够精确,还容易泄露征信报告中的信息。
技术实现思路
基于此,有必要针对上述审核结果不够精确以及容易泄露征信报告中信息的问题,提供一种征信报告识别方法、装置、计算机设备及存储介质。一种征信报告识别方法,所述方法包括:获取征信报告,所述征信报告为含有信用信息的影印资料,所述征信报告携带有唯一标识;采用OCR技术识别所述征信报告以将所述影印资料转换为文本信息,将所述文本信息作为识别结果输出;检测所述识别结果的准确率;当所述识别结果的准确率符合预设条件时,输出识别结果。在一个实施例中,所述获取征信报告,包括:获取征信报告的唯一标识;当数据库中不存在获取的所述征信报告的唯一标识时,则获取的征信报告为未下载过的征信报告;检测所述未下载过的征信报告的唯一标识在日志中的记录,当存在日志记录时,征信报告获取成功。在一个实施例中,所述采用OCR技术识别所述征信报告以将所述影印资料转换为文本信息,包括:获取所述征信报告的类别,根据所述类别获取对应的预设OCR识别模板,根据所述预设OCR识别模板识别所述征信报告以将所述影音资料转换为文本信息。在一个实施例中,在获取征信报告之前还包括:获取征信报告样本,对所述征信报告样本进行分类;根据所述分类设置对应的OCR识别模板,并在所述OCR识别模板中设置模板定位字符、字符依赖关系以及识别结果输出结构。在一个实施例中,所述检测所述识别结果的准确率,包括:计算所述识别结果中的字符的置信度;根据所述字符的置信度得出所述识别结果的准确率。在一个实施例中,所述当所述识别结果的准确率符合预设条件时,输出识别结果,包括:当所述识别结果的准确率达到预设字符精度时,将所述识别结果按照所述识别结果输出结构进行输出。在一个实施例中,在所述输出识别结果之后,还包括:当输出的识别结果达到设定数量时,对所述识别结果进行批量入库。一种征信报告识别装置,所述装置包括:报告获取模块,用于获取征信报告,所述征信报告为含有信用信息的影印资料,所述征信报告携带有唯一标识;信息转换模块,用于采用OCR技术识别所述征信报告以将所述影印资料转换为文本信息,将所述文本信息作为识别结果输出;结果检测模块,用于检测所述识别结果的准确率;结果输出模块,用于当所述识别结果的准确率符合预设条件时,输出识别结果。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上所述方法的步骤。上述征信报告识别方法、装置、计算机设备及存储介质,获取征信报告,征信报告为含有信用信息的影印资料,征信报告携带有唯一标识,采用OCR技术识别征信报告以将影印资料转换为文本信息,将文本信息作为识别结果输出,检测识别结果的准确率,当识别结果的准确率符合预设条件时,输出识别结果。由于使用了OCR技术,在对征信报告进行查看和审核的时候,只需要终端自动进行操作,不需要耗费大量的人力和物力,而且,通过终端自动进行操作结果比较精确,不易泄露征信报告中的信息。附图说明图1为一个实施例中征信报告识别方法的应用环境图;图2为一个实施例中图1中终端的内部结构图;图3为一个实施例中征信报告识别方法的流程图;图4为一个实施例中获取征信报告的方法流程图;图5为一个实施例中设置模板的方法流程图;图6为一个实施例中检测识别结果准确率的方法流程图;图7为一个实施例中征信报告识别装置的结构框图;图8为另一个实施例中征信报告识别装置的结构框图;图9为再一个实施例中征信报告识别装置的结构框图。具体实施方式为使本专利技术的目的、特征和优点能够更加明显易懂,下面结合附图对本专利技术的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本专利技术。但是本专利技术能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本专利技术内涵的情况下做类似改进,因此本专利技术不受下面公开的具体实施的限制。图1为一个实施例中征信报告识别方法的应用环境图。如图1所示,该应用环境包括终端110和服务器120,其中,终端110和服务器120之间通过网络进行通信。终端110可为笔记本电脑、台式计算机、个人数字电脑、便携式膝上型电脑等,但并不局限于此。终端110通过服务器120获取征信报告的影印文件,并对获取到的影印文件进行检测,以确定成功获取征信报告的影印文件。终端110采用OCR技术识别征信报告,得到识别结果并对识别结果的准确率进行检测后,终端110会按照固定的格式输出识别结果,再将输出的识别结果批量入库,终端110会将入库的识别结果上传到服务器120中进行存储。在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端110,图1中的终端110的内部结构如图2所示,该终端110包括通过系统总线连接的处理器、存储介质、内存、显示器和网络接口。其中,终端110的存储介质存储有操作系统、数据库,还包括用于实现征信报告识别方法和装置的计算机程序。该处理器用于提供计算和控制能力,支撑整个终端110的运行。终端110中的显示器用于显示信息,例如,当征信报告影印资料获取失败时,会接收到邮件通知,显示器用于显示收到的邮件,内存为存储介质中实现征信报告识别方法和装置的计算机程序的运行提供环境,网络接口用于与服务器120进行网络通信,例如,网络接口可将按照格式输出的识别结果批量入库并上传到服务器120进行存储。图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的终端的限定,具体的终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。在一个实施例中,提供了一种征信报告识别方法,以应用于上述应用环境中的终端来举例说明,如图3所示,包括如下步骤:步骤S302,获取征信报告,征信报告为含有信用信息的影印资料,征信报告携带有唯一标识。其中,征信报告是金融行业信用评估的主要来源和依据,分为个人信用报告和企业信用报告,用于查询个人或企业的社会信用。终端通过服务器从数据库获取到征信报告,这里获取到的征信报告是纯图片格式,并且每份征信报告都携带有唯一标识。步骤S304,采用OCR技术识别征信报告以将影印资料转换为文本信息,将文本信息作为识别结果输出。其中,OCR技术是光学字符识别的缩写(OpticalCharacterRecognition),是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。采用OCR技术对征信报告进行识别,利用OC本文档来自技高网...
征信报告识别方法、装置、计算机设备及存储介质

【技术保护点】
一种征信报告识别方法,其特征在于,所述方法包括:获取征信报告,所述征信报告为含有信用信息的影印资料,所述征信报告携带有唯一标识;采用OCR技术识别所述征信报告以将所述影印资料转换为文本信息,将所述文本信息作为识别结果输出;检测所述识别结果的准确率;当所述识别结果的准确率符合预设条件时,输出识别结果。

【技术特征摘要】
1.一种征信报告识别方法,其特征在于,所述方法包括:获取征信报告,所述征信报告为含有信用信息的影印资料,所述征信报告携带有唯一标识;采用OCR技术识别所述征信报告以将所述影印资料转换为文本信息,将所述文本信息作为识别结果输出;检测所述识别结果的准确率;当所述识别结果的准确率符合预设条件时,输出识别结果。2.根据权利要求1所述的方法,其特征在于,所述获取征信报告,包括:获取征信报告的唯一标识;当数据库中不存在获取的所述征信报告的唯一标识时,则获取的征信报告为未下载过的征信报告;检测所述未下载过的征信报告的唯一标识在日志中的记录,当存在日志记录时,征信报告获取成功。3.根据权利要求1所述的方法,其特征在于,所述采用OCR技术识别所述征信报告以将所述影印资料转换为文本信息,包括:获取所述征信报告的类别,根据所述类别获取对应的预设OCR识别模板,根据所述预设OCR识别模板识别所述征信报告以将所述影印资料转换为文本信息。4.根据权利要求3所述的方法,其特征在于,在获取征信报告之前还包括:获取征信报告样本,对所述征信报告样本进行分类;根据所述分类设置对应的OCR识别模板,并在所述OCR识别模板中设置模板定位字符、字符依赖关系以及识别结果输出结构。5.根据权利要求1所述的方法,其特征在于,所述检测所述识别结果的准确率,...

【专利技术属性】
技术研发人员:秦祎晗刘奕慧郭玮
申请(专利权)人:深圳市牛鼎丰科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1