征信报告解析方法、服务器及存储介质技术

技术编号:18238541 阅读:38 留言:0更新日期:2018-06-17 02:10
本发明专利技术公开了一种征信报告解析方法、服务器及存储介质。所述征信报告解析方法包括:服务器响应于征信报告查询指令,获取目标征信报告;从所述目标征信报告中提取目标文档结构类型,根据所述目标文档结构类型确定目标解析模型;根据所述目标解析模型对所述目标征信报告进行解析,获得用户信息。本发明专利技术中通过不同文档结构类型的征信报告调用对应的解析模型进行解析,灵活应对不同格式以及不断变化的模块,提高了征信报告的解析时效,满足业务需求。 1

Analysis method, server and storage medium for credit reporting

The invention discloses a credit reporting analysis method, a server and a storage medium. The analysis methods of the reporting report include: the server responds to the query instruction of the credit report, gets the target letter report, extracts the structure type of the target document from the target reporting report, determines the target analytic model according to the structure type of the target document, and reports the target letter reporting according to the target analytic model. Line parsing to get user information. In this invention, the corresponding analytical model is called through the corresponding model of different document structure types, and it is flexible to cope with different formats and changing modules, so as to improve the resolution of the letter reporting and meet the needs of the business. One

【技术实现步骤摘要】
征信报告解析方法、服务器及存储介质
本专利技术涉及金融业信贷
,尤其涉及征信报告解析方法、服务器及存储介质。
技术介绍
金融业信贷业务,对于客户征信报告有强相关依赖要求,人行征信报告具有统一、全面及权威等方面的重要意义,所以各贷款业务均使用征信报告进行风险评估,以科学及安全可控的开展业务。由于征信报告的重要性,各金融机构均会成立独立的征信系统,获取、解析和存储征信数据,以便重用、把控、精细化分析以及输入风险评估决策系统。在征信系统中,其重要模块在于报告解析,具体体现为:征信报告样式多样:银行版WORD、超级文本标记语言(HyperTextMarkupLanguage,HTML)及便携式文档格式(PortableDocumentFormat,PDF)格式,个人版WORD、HTML及PDF格式,个人版一页双版格式等;各银行特有的征信数据,格式定义各不相同,如:JavaScript对象标记语言(JavaScriptObjectNotation,JSON)、可扩展标记语言(ExtensibleMarkupLanguage,XML)、WORD、数据传输对象(DataTransferObject,DTO)或HTML等不同文档结构;人行、银行及金融机构,均不断丰富模板内容。如何高效灵活应对各式各样的征信报告格式从而获取到用户信息是亟待解决的技术问题。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供征信报告解析方法、服务器及存储介质,旨在解决如何高效灵活应对各式各样的征信报告格式从而获取到用户信息的技术问题。为实现上述目的,本专利技术提供一种征信报告解析方法,所述征信报告解析方法包括以下步骤:服务器响应于征信报告查询指令,获取目标征信报告;从所述目标征信报告中提取目标文档结构类型,根据所述目标文档结构类型确定目标解析模型;根据所述目标解析模型对所述目标征信报告进行解析,获得用户信息。优选地,所述根据所述目标文档结构类型确定目标解析模型,具体包括:从映射关系表中获取与所述目标文档结构类型对应的目标解析模型,所述映射关系表中包括文档结构类型与解析模型之间的对应关系。优选地,所述响应于征信报告查询指令,获取目标征信报告之前,所述征信报告解析方法还包括:获取多种不同的文档结构类型,为各文档结构类型分别建立对应的解析模型。优选地,所述为各文档结构类型分别建立对应的解析模型,具体包括:分别获取与各文档结构类型对应的Xpath路径,根据各文档结构类型及对应的Xpath路径,为各文档结构类型分别建立对应的解析模型。优选地,所述根据所述目标解析模型对所述目标征信报告进行解析,获得用户信息,具体包括:调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径对所述目标征信报告进行解析,获得用户信息。优选地,所述调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径对所述目标征信报告进行解析,获得用户信息,具体包括:调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径遍历所述目标征信报告,将遍历到的标题作为目标标题进行定位,根据所述目标标题查找目标内容,对所述目标内容进行萃取,获得用户信息。优选地,所述根据所述目标标题查找目标内容,具体包括:根据所述目标标题通过所述目标解析模型中的预设匹配函数查找目标内容。优选地,所述对所述目标内容进行萃取,获得用户信息,具体包括:通过所述目标解析模型中的预设解析器,递归萃取所述目标内容,获得用户信息。此外,为实现上述目的,本专利技术还提供一种服务器,所述服务器包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的征信报告解析程序,所述征信报告解析程序配置为实现如上文所述征信报告解析方法的步骤。此外,为实现上述目的,本专利技术还提供一种存储介质,所述存储介质上存储有征信报告解析程序,所述征信报告解析程序被处理器执行时实现如上文所述的征信报告解析方法的步骤。本专利技术中通过不同文档结构类型的征信报告调用对应的解析模型进行解析,灵活应对不同格式以及不断变化的模块,提高了征信报告的解析时效,满足业务需求。附图说明图1是本专利技术征信报告解析方法实施例方案涉及的硬件运行环境的服务器结构示意图;图2为本专利技术征信报告解析方法第一实施例的流程示意图;图3为本专利技术征信报告解析方法第二实施例的流程示意图;图4为本专利技术征信报告解析方法第三实施例的流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。参照图1,图1为本专利技术实施例方案涉及的硬件运行环境的服务器结构示意图。如图1所示,该服务器可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display),可选用户接口1003还可以包括标准的有线接口、无线接口,对于用户接口1003的有线接口在本专利技术中可为USB接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及征信报告解析程序。在图1所示的服务器中,网络接口1004主要用于连接后台服务器,与所述后台服务器进行数据通信;用户接口1003主要用于连接外设;所述服务器通过处理器1001调用存储器1005中存储的征信报告解析程序,并执行以下操作:响应于征信报告查询指令,获取目标征信报告;从所述目标征信报告中提取目标文档结构类型,根据所述目标文档结构类型确定目标解析模型;根据所述目标解析模型对所述目标征信报告进行解析,获得用户信息。进一步地,处理器1001可以调用存储器1005中存储的征信报告解析程序,还执行以下操作:从映射关系表中获取与所述目标文档结构类型对应的目标解析模型,所述映射关系表中包括文档结构类型与解析模型之间的对应关系。进一步地,处理器1001可以调用存储器1005中存储的征信报告解析程序,还执行以下操作:获取多种不同的文档结构类型,为各文档结构类型分别建立对应的解析模型。进一步地,处理器1001可以调用存储器1005中存储的征信报告解析程序,还执行以下操作:分别获取与各文档结构类型对应的Xpath路径,根据各文档结构类型及对应的Xpath路径,为各文档结构类型分别建立对应的解析模型。进一步地,处理器1001可以调用存储器1005中存储的征信报告解析程序,还执行以下操作:调用所述目标解析模型,以根据所述目标解析模型中的Xpath路径对所述目标征信报告进行解析,获得用户信息。进一步地,处理器1001可以调用存储器1005中存储的征信报告解析程序,还执行以本文档来自技高网...
征信报告解析方法、服务器及存储介质

【技术保护点】
1.一种征信报告解析方法,其特征在于,所述征信报告解析方法包括以下步骤:

【技术特征摘要】
1.一种征信报告解析方法,其特征在于,所述征信报告解析方法包括以下步骤:服务器响应于征信报告查询指令,获取目标征信报告;从所述目标征信报告中提取目标文档结构类型,根据所述目标文档结构类型确定目标解析模型;根据所述目标解析模型对所述目标征信报告进行解析,获得用户信息。2.如权利要求1所述的征信报告解析方法,其特征在于,所述根据所述目标文档结构类型确定目标解析模型,具体包括:从映射关系表中获取与所述目标文档结构类型对应的目标解析模型,所述映射关系表中包括文档结构类型与解析模型之间的对应关系。3.如权利要求2所述的征信报告解析方法,其特征在于,所述响应于征信报告查询指令,获取目标征信报告之前,所述征信报告解析方法还包括:获取多种不同的文档结构类型,为各文档结构类型分别建立对应的解析模型。4.如权利要求3所述的征信报告解析方法,其特征在于,所述为各文档结构类型分别建立对应的解析模型,具体包括:分别获取与各文档结构类型对应的Xpath路径,根据各文档结构类型及对应的Xpath路径,为各文档结构类型分别建立对应的解析模型。5.如权利要求4所述的征信报告解析方法,其特征在于,所述根据所述目标解析模型对所述目标征信报告进行解析,获得用户信息,具体包括:调用所述目标解析模型,以根据所述目标解析模型中的Xpath...

【专利技术属性】
技术研发人员:张天生
申请(专利权)人:深圳前海大数金融服务有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1