信用卡的风险预测方法、装置、电子设备和存储介质制造方法及图纸

技术编号:33646446 阅读:40 留言:0更新日期:2022-06-02 20:23
本申请涉及信用卡的风险预测方法、装置、电子设备和存储介质,属于机器学习领域,本申请实施例通过第一GBDT模型预测第一结果,通过GraphSage模型预测第二结果,通过GraphSage模型和第二GBDT模型预测第三结果,然后进行结果的融合,不仅实现了多模型融合,而且,根据信用卡数据构造异构图,通过异构图数据充分表达群体属性,通过节点的向量表达准确体现群体风险特征,使得第二结果和第三结果更为精准,因此,本申请实施例将第一结果、第二结果和第三结果进行融合,得到最终的预测结果,从整体上极大程度的提高了预测结果的准确性。程度的提高了预测结果的准确性。程度的提高了预测结果的准确性。

【技术实现步骤摘要】
信用卡的风险预测方法、装置、电子设备和存储介质


[0001]本申请涉及机器学习
,特别是信用卡的风险预测方法、装置、电子设备和存储介质。

技术介绍

[0002]近年来,随着经济的繁荣发展和信用消费在年轻一代的普及,我国的信用卡发行量和交易量都在不断增加,随之而来的是信用卡的风险问题,因此,银行需要对其信用卡的应用场景进行风险预测。
[0003]一方面,传统的预测方式一般通过单一模型来进行风险的识别,由于单个模型原理简单,利用到的有效数据信息较少,使得模型的预测结果准确率偏低;另一方面,在银行信用卡风控场景下,风险特征往往具有群体属性,而传统的单一模型预测方式不能有效的表达群体风险特征,这会使得特征的表达有所欠缺,进一步影响最终预测结果的准确性。

技术实现思路

[0004]本申请实施例提供了一种信用卡的风险预测方法、装置、电子设备和存储介质,以至少解决相关技术中信用卡风险预测结果准确性低的问题。
[0005]第一方面,本申请实施例提供了一种信用卡的风险预测方法,包括:读取信用卡的原始数据,对所述原始数据进行清洗,得到清洗后的数据;将所述清洗后的数据经过特征工程得到特征数据,将所述特征数据输入预先训练的第一 GBDT模型,输出第一结果;根据所述清洗后的数据构造异构图,得到异构图数据,将所述异构图数据通过GraphSage模型改造,得到节点的向量表达,将所述节点的向量表达输入所述GraphSage模型的分类层,输出第二结果;将所述特征数据和所述节点的向量表达进行拼接,将拼接后的特征输入预先训练的第二GBDT模型,输出第三结果;将所述第一结果、所述第二结果和所述第三结果进行融合,得到预测结果。
[0006]在其中一些实施例中,所述将所述第一结果、所述第二结果和所述第三结果进行融合,得到预测结果包括:将所述第一结果、所述第二结果和所述第三结果输入Stacking模型进行融合,输出融合后的结果;将所述融合后的结果输入预先训练的Logistic回归模型,输出所述预测结果。
[0007]在其中一些实施例中,所述根据所述清洗后的数据构造异构图,得到异构图数据包括:依据Schema构造异构图,得到节点数据和边数据,其中,所述节点用于表示实体,所述边用于表示实体间的关系。
[0008]在其中一些实施例中,所述将所述异构图数据通过GraphSage模型改造,得到节点的向量表达包括:对各类型的实体,根据属性特征进行归一化的向量表征,并对邻居节点进行采样;将采样数据按照实体类型进行分组,将分组结果通过所述GraphSage模型进行向量堆叠,形成矩阵;将所述矩阵输入所述 GraphSage模型的全连接层,输出所述节点的向量表达。
[0009]在其中一些实施例中,所述GraphSage模型的训练方式如下:对各类型的实体,根据属性特征进行归一化的向量表征,并采样邻居节点,得到待聚合节点集合;对所述待聚合节点集合中相同类型的节点通过GraphSage模型的最大池化层进行聚合,得到聚合后的多个向量,对所述多个向量进行堆叠得到矩阵;将所述矩阵输入所述GraphSage模型的全连接层,得到节点的向量表达;将所述节点的向量表达输入所述GraphSage模型的分类层,输出预测值;基于所述预测值和真实值计算损失,并更新参数,当损失收敛时,停止训练。
[0010]在其中一些实施例中,所述GraphSage模型的训练方式还包括:依据所述 GraphSage模型的MiniBatch方式,采样相邻两跳的邻居节点,得到所述待聚合节点集合,基于所述待聚合节点集合进行训练,其中,所述相邻两跳的邻居节点包括一度相关联节点和二度相关联节点。
[0011]在其中一些实施例中,所述读取信用卡的原始数据包括:通过Hive读取存储在贴源层的信用卡的原始数据。
[0012]第二方面,本申请实施例提供一种信用卡的风险预测装置,包括:预处理模块、第一计算模块、第二计算模块、第三计算模块和融合模块。预处理模块用于读取信用卡的原始数据,对所述原始数据进行清洗,得到清洗后的数据;第一计算模块用于将所述清洗后的数据经过特征工程得到特征数据,将所述特征数据输入预先训练的第一GBDT模型,输出第一结果;第二计算模块用于根据所述清洗后的数据构造异构图,得到异构图数据,将所述异构图数据通过 GraphSage模型改造,得到节点的向量表达,将所述节点的向量表达输入所述 GraphSage模型的分类层,输出第二结果;第三计算模块用于将所述特征数据和所述节点的向量表达进行拼接,将拼接后的特征输入预先训练的第二GBDT模型,输出第三结果;融合模块用于将所述第一结果、所述第二结果和所述第三结果进行融合,得到预测结果。
[0013]第三方面,本申请实施例提供一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项所述的方法。
[0014]第四方面,本申请实施例提供一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项所述的方法。
[0015]相比于相关技术,本申请实施例通过第一GBDT模型预测第一结果,通过 GraphSage模型预测第二结果,通过GraphSage模型和第二GBDT模型预测第三结果,然后进行结果的融合,不仅实现了多模型融合,而且,在获取第二结果的过程中,根据信用卡数据构造异构图,通过异构图数据表达群体属性,通过节点的向量表达体现群体风险特征,使得第二结果和第三结果更为精准,因此,本申请实施例将第一结果、第二结果和第三结果进行融合,得到最终的预测结果,极大程度的提高了预测结果的准确性。
附图说明
[0016]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0017]图1是根据本申请实施例提供的一种信用卡的风险预测方法的流程图;
[0018]图2是根据本申请实施例提供的一种举例的信用卡的风险预测方法的流程图;
[0019]图3是根据本申请实施例提供的一种异构图的局部示意图;
[0020]图4是根据本申请实施例提供的一种采样邻居节点的范围表达示意图;
[0021]图5是根据本申请实施例提供的一种采样邻居节点的数量表达示意图;
[0022]图6是根据本申请实施例提供的一种信用卡的风险预测装置的结构框图;
[0023]图7是根据本申请实施例提供的一种电子设备的内部结构示意图。
具体实施方式
[0024]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信用卡的风险预测方法,其特征在于,包括:读取信用卡的原始数据,对所述原始数据进行清洗,得到清洗后的数据;将所述清洗后的数据经过特征工程得到特征数据,将所述特征数据输入预先训练的第一GBDT模型,输出第一结果;根据所述清洗后的数据构造异构图,得到异构图数据,将所述异构图数据通过GraphSage模型改造,得到节点的向量表达,将所述节点的向量表达输入所述GraphSage模型的分类层,输出第二结果;将所述特征数据和所述节点的向量表达进行拼接,将拼接后的特征输入预先训练的第二GBDT模型,输出第三结果;将所述第一结果、所述第二结果和所述第三结果进行融合,得到预测结果。2.根据权利要求1所述的方法,其特征在于,所述将所述第一结果、所述第二结果和所述第三结果进行融合,得到预测结果包括:将所述第一结果、所述第二结果和所述第三结果输入Stacking模型进行融合,输出融合后的结果;将所述融合后的结果输入预先训练的Logistic回归模型,输出所述预测结果。3.根据权利要求1所述的方法,其特征在于,所述根据所述清洗后的数据构造异构图,得到异构图数据包括:依据Schema构造异构图,得到节点数据和边数据,其中,所述节点用于表示实体,所述边用于表示实体间的关系。4.根据权利要求3所述的方法,其特征在于,所述将所述异构图数据通过GraphSage模型改造,得到节点的向量表达包括:对各类型的实体,根据属性特征进行归一化的向量表征,并对邻居节点进行采样;将采样数据按照实体类型进行分组,将分组结果通过所述GraphSage模型进行向量堆叠,形成矩阵;将所述矩阵输入所述GraphSage模型的全连接层,输出所述节点的向量表达。5.根据权利要求1

4中任一所述的方法,其特征在于,所述GraphSage模型的训练方式如下:对各类型的实体,根据属性特征进行归一化的向量表征,并采样邻居节点,得到待聚合节点集合;对所述待聚合节点集合中相同类型的节点通过Graph...

【专利技术属性】
技术研发人员:何免郭磊符国辉何保健
申请(专利权)人:同盾科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1