一种将人行网页版信用报告转换为接口版信用报告的方法技术

技术编号:36695833 阅读:36 留言:0更新日期:2023-02-27 20:07
本发明专利技术公开了一种将人行网页版信用报告转换为接口版信用报告的方法,根据人行接口版信用报告格式设计实体类ICRDocument及其下属各层级实体类,读取人行网页版信用报告并将网页版信用报告解析至实体类ICRDocument及其下属各层级实体类中,得到一个ICRDocument对象,通过序列化工具xstream将ICRDocument对象转化为XML字符串,从而得到接口版信用报告。本发明专利技术大大提高了数据获取的效率和速度,并且可以进行后续数据分析,提高分析报文的速度和效率。率。率。

【技术实现步骤摘要】
一种将人行网页版信用报告转换为接口版信用报告的方法


[0001]本专利技术涉及一种报告转换方法,特别是一种将人行网页版信用报告转换为接口版信用报告的方法,属于消费金融软件


技术介绍

[0002]根据服务对象的不同,二代个人信用报告分为服务于接入机构的授信机构版、服务于信息主体本人的本人简版和本人详版,以及服务于有权部门的国家机关版。根据查询渠道的不同,授信机构版的展示样式又分为两类:一是以接口查询方式提供的“XML”样式,方便机器解析。二是以页面查询方式提供的“PDF”、“HTML”样式,方便人工阅读。
[0003]很多机构由于条件达不到申请人行接口查询账号的条件,所以只能使用网页版(html)信用报告进行分析,由于报告内含有大量样式代码,不便于解析,不利于数据结构与模型分析。而接口版(xml)信用报告由数据块和信息单元所对应的XML标签及其中的信息数据所组成,方便机器解析。因此,目前对于达不到申请人行接口查询账号的条件的机构,只能够读取网页版的信用报告通过人工查看的方式进行报告信息的获取,报告获取速度慢、效率低下,并且难以进行数据的自动分析。

技术实现思路

[0004]本专利技术所要解决的技术问题是提供一种将人行网页版信用报告转换为接口版信用报告的方法,使达不到人行接口查询账号条件的机构也能够高效获取接口版信用报告格式的数据。
[0005]为解决上述技术问题,本专利技术所采用的技术方案是:一种将人行网页版信用报告转换为接口版信用报告的方法,其特征在于包含以下步骤:S1、根据人行接口版信用报告格式设计实体类ICRDocument及其下属各层级实体类,实体类中各属性也根据信用报告中各信息单元中的标签进行设计;S2、读取人行网页版信用报告并将网页版信用报告解析至实体类ICRDocument及其下属各层级实体类中,得到一个ICRDocument对象;S3、通过序列化工具xstream将ICRDocument对象转化为XML字符串,从而得到接口版信用报告。
[0006]进一步地,所述步骤S1中,设计的实体类ICRDocument及其下属各层级实体类的结构与人行提供的接口版信用报告的格式保持一致。
[0007]进一步地,所述步骤S2具体为:2.1、通过Jsoup将人行网页版信用报告转化为Document类型;2.2、获取人行网页版信用报告的主体部分:Document. body().child(0),并去除无用的标签;2.3、根据各模块标题获取其父标签<div>内容,从而获取各模块的内容;
2.4、获取各模块的内容后,按照<table><tr><td>标签,分别解析获取到的各模块的内容,并根据标签的个数及内容,声明并实例化实体类ICRDocument及其下属各层级实体类中各模块的内容的对象,给实体类中各属性赋值;2.5、解析完各模块的内容后,将各模块的内容中的中文码值字段根据标准代码表进行转换。
[0008]进一步地,所述步骤2.2中,无用的标签包含"br",、"style"、 "script"和"img"。
[0009]进一步地,所述步骤S3中,得到的接口版信用报告在读取的人行网页版信用报告文件路径下生成一个同名的XML文件。
[0010]本专利技术与现有技术相比,具有以下优点和效果:本专利技术提供了一种将人行网页版信用报告转换为接口版信用报告的方法,从而使达不到申请人行接口查询账号条件的机构也能够获取与人行接口版信用报告相同的数据格式,大大提高了数据获取的效率和速度,并且可以进行后续数据分析,提高分析报文的速度和效率。
附图说明
[0011]图1是本专利技术的一种将人行网页版信用报告转换为接口版信用报告的方法的逻辑示意图。
具体实施方式
[0012]为了详细阐述本专利技术为达到预定技术目的而所采取的技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清晰、完整地描述,显然,所描述的实施例仅仅是本专利技术的部分实施例,而不是全部的实施例,并且,在不付出创造性劳动的前提下,本专利技术的实施例中的技术手段或技术特征可以替换,下面将参考附图并结合实施例来详细说明本专利技术。
[0013]如图1所示,本专利技术的将人行网页版信用报告转换为接口版信用报告的方法,包含以下步骤:S1、根据人行接口版信用报告格式设计实体类ICRDocument及其下属各层级实体类,实体类中各属性也根据信用报告中各信息单元中的标签进行设计。设计的实体类ICRDocument及其下属各层级实体类的结构与人行提供的接口版信用报告的格式保持一致。
[0014]S2、读取人行网页版信用报告并将网页版信用报告解析至实体类ICRDocument及其下属各层级实体类中,得到一个ICRDocument对象。
[0015]2.1、通过Jsoup将人行网页版信用报告转化为Document类型。Jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。
[0016]2.2、获取人行网页版信用报告的主体部分:Document. body().child(0),并去除无用的标签;无用的标签包含"br",、"style"、 "script"和"img"等。
[0017]2.3、根据各模块标题获取其父标签<div>内容,从而获取各模块的内容。
[0018]各模块标题举例如下:0.1 个人信用报告
0.2 个人基本信息0.2.1 身份信息0.2.2 配偶信息0.2.3 居住信息0.2.4 职业信息0.3 信息概要0.3.1 个人信用报告“数字解读”0.3.2 信贷交易信息提示0.3.3 信贷交易违约信息概要0.3.3.1 被追偿信息汇总0.3.3.2 呆账信息汇总0.3.3.3 逾期(透支)信息汇总0.3.4 信贷交易授信及负债信息概要0.3.4.1 非循环贷账户信息汇总0.3.4.2 循环额度下分账户信息汇总0.3.4.3 循环贷账户信息汇总0.3.4.4 贷记卡账户信息汇总0.3.4.5 准贷记卡账户信息汇总0.3.4.6 相关还款责任信息汇总0.3.5 非信贷交易信息概要0.3.6 公共信息概要0.3.7 查询记录概要0.4 信贷交易信息明细0.4.1 被追偿信息0.4.2 非循环贷账户0.4.3 循环额度下分账户0.4.4 循环贷账户0.4.5 贷记卡账户0.4.6 准贷记卡账户0.4.7 相关还款责任信息0.4.7.1 有相关还款责任的个人借款0.4.7.2 有相关还款责任的企业借款0.4.8 授信协议信息0.5 非信贷交易信息明细0.5.1 后付费记录0.6 公共信息明细0.6.1 欠税记录0.6.2 民事判决记录0.6.3 强制执行记录
0.6.4 行政处罚记录0.6.5 住房公积本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种将人行网页版信用报告转换为接口版信用报告的方法,其特征在于包含以下步骤:S1、根据人行接口版信用报告格式设计实体类ICRDocument及其下属各层级实体类,实体类中各属性也根据信用报告中各信息单元中的标签进行设计;S2、读取人行网页版信用报告并将网页版信用报告解析至实体类ICRDocument及其下属各层级实体类中,得到一个ICRDocument对象;S3、通过序列化工具xstream将ICRDocument对象转化为XML字符串,从而得到接口版信用报告。2.根据权利要求1所述一种将人行网页版信用报告转换为接口版信用报告的方法,其特征在于:所述步骤S1中,设计的实体类ICRDocument及其下属各层级实体类的结构与人行提供的接口版信用报告的格式保持一致。3.根据权利要求1所述一种将人行网页版信用报告转换为接口版信用报告的方法,其特征在于:所述步骤S2具体为:2.1、通过Jsoup将人行网页版信用报告转化为Document类型;2.2、获取人行网页版信用报告的主体部分:Document. bo...

【专利技术属性】
技术研发人员:吴静莹高鹏祁子心
申请(专利权)人:苏银凯基消费金融有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1