信用卡用户风险类别识别方法、装置、计算机设备和介质制造方法及图纸

技术编号:32644034 阅读:9 留言:0更新日期:2022-03-12 18:22
本申请涉及一种信用卡用户风险类别识别方法、装置、计算机设备、存储介质和计算机程序产品,应用于大数据领域。本申请能够提高对信用卡用户风险类别的识别准确度。该方法包括:获取信用卡用户的用户信息;利用逐步回归模型和多元逻辑回归模型从用户信息中筛选得到多个风险影响因素;将多个风险影响因素对应的属性值输入预先构建的决策树模型中进行遍历,获取决策树模型输出的信用卡用户所属的风险类别。别。别。

【技术实现步骤摘要】
信用卡用户风险类别识别方法、装置、计算机设备和介质


[0001]本申请涉及大数据
,特别是涉及一种信用卡用户风险类别识别方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着信用卡的普及,信用卡业务在银行业务体系中扮演着越来越重要的角色。预测信用卡用户是否为风险用户有利于尽早识别出风险用户和优质用户,以使银行及时采取降低风险用户的信用卡额度、适度增加优质用户的信用卡额度曾方式,减少风险用户带来的损失以期更好地为优质用户提供服务。
[0003]目前对信用卡用户风险类别的识别技术中一般采用与用户相关的所有用户信息进行建模,但没有对所有用户信息加以区分和筛选而使其难以有效提取对信用卡风险有较显著影响的用户信息,导致此种方式对信用卡用户风险类别的识别准确度不够高。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种信用卡用户风险类别识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种信用卡用户风险类别识别方法。所述方法包括:
[0006]步获取信用卡用户的用户信息;
[0007]通过逐步回归模型和多元逻辑回归模型从所述用户信息中筛选得到多个风险影响因素;
[0008]将所述多个风险影响因素对应的属性值输入预先构建的决策树模型中进行遍历,获取所述决策树模型输出的所述信用卡用户所属的风险类别。
[0009]在其中一个实施例中,所述将所述多个风险影响因素对应的属性值输入预先构建的决策树模型中进行遍历,得到所述信用卡用户的信用风险值之前,所述方法还包括:
[0010]获取所述多个影响因素对应的训练样本数据;
[0011]使用所述训练样本数据对以C4.5为基础结构的决策树模型进行训练,得到所述预先构建的决策树模型。
[0012]在其中一个实施例中,所述使用所述训练样本数据对以C4.5为基础结构的决策树模型进行训练,得到所述预先构建的决策树模型,包括:
[0013]将训练样本数据集放在父节点上;
[0014]针对每个父节点,遍历所述父节点上的所述训练样本数据集对应的分割方式,找到最佳分割方式;
[0015]以所述最佳分割方式中的阈值作为分割点,将所述训练样本数据集分割为多个子数据集,并将所述多个子数据集分别分配到所述父节点对应的子节点上,调整所述以C4.5为基础结构的决策树模型中的模型参数,直到所述子节点上的所述子数据集不能再分割为止,得到所述预先构建的决策树模型。
[0016]在其中一个实施例中,所述逐步回归模型为后退型逐步回归模型;所述通过逐步回归模型和多元逻辑回归模型从所述用户信息中筛选得到多个影响因素,包括:
[0017]通过所述后退型逐步回归模型从所述用户信息中筛选得到第一变量集合;
[0018]通过多元逻辑回归模型从所述第一变量集合中筛选得到所述多个影响因素。
[0019]在其中一个实施例中,所述通过所述后退型逐步回归模型从所述用户信息中筛选得到第一变量集合,包括:
[0020]基于全部所述用户信息构建解释变量集;
[0021]将所述解释变量集中的各个解释变量作为自变量,以风险用户类别作为因变量,构建线性回归模型;
[0022]针对所述线性回归模型进行多轮显著性校验;在每轮显著性校验中,计算每个自变量对所述因变量的贡献值,剔除所述贡献值最小的因变量,得到下一个线性回归模型,直至没有自变量剔除为止,得到未被剔除的自变量作为所述第一变量集合。
[0023]在其中一个实施例中,所述多元逻辑回归模型是基于Sigmoid函数构建的。
[0024]第二方面,本申请还提供了一种信用卡用户风险类别识别装置。所述装置包括:
[0025]用户信息获取模块,用于获取信用卡用户的用户信息;
[0026]风险影响因素筛选模块,用于通过逐步回归模型和多元逻辑回归模型从所述用户信息中筛选得到多个风险影响因素;
[0027]风险类别输出模块,用于将所述多个风险影响因素对应的属性值输入预先构建的决策树模型中进行遍历,获取多数决策树模型输出的所述信用卡用户所属的风险类别。
[0028]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述信用卡用户风险类别识别方法实施例中的各步骤。
[0029]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述信用卡用户风险类别识别方法实施例中的各步骤。
[0030]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述信用卡用户风险类别识别方法实施例中的各步骤。
[0031]上述信用卡用户风险类别识别方法、装置、计算机设备、存储介质和计算机程序产品,通过获取信用卡用户的用户信息;利用逐步回归模型和多元逻辑回归模型从用户信息中筛选得到多个风险影响因素;将多个风险影响因素对应的属性值输入预先构建的决策树模型中进行遍历,获取决策树模型输出的信用卡用户所属的风险类别。本申请通过从用户信息中有效筛选出多个风险影响因素并借助决策树模型据此识别信用卡用户所属的风险类别,提高对信用卡用户风险类别的识别准确度,且可具体针对现有的用户数据识别出用户是否存在信用违约风险,有利于降低信用卡违约率,针对无信用违约风险的用户,可进一步采取信用卡业务相关调整方式进行整体用户服务优化。
附图说明
[0032]图1为一个实施例中信用卡用户风险类别识别方法的应用环境图;
[0033]图2为一个实施例中信用卡用户风险类别识别方法的流程示意图;
[0034]图3为一个实施例中运用多元逻辑回归模型进行显著性校验的校验结果;
[0035]图4为一个实施例中运用逐步回归模型筛选变量的筛选结果;
[0036]图5为一个实施例中剔除性别后运用逐步回归模型筛选变量的筛选结果;
[0037]图6为一个实施例中决策树模型的示意图;
[0038]图7为一个实施例中信用卡用户风险类别识别装置的结构框图;
[0039]图8为一个实施例中计算机设备的内部结构图。
[0040]图9为另一个实施例中计算机设备的内部结构图。
具体实施方式
[0041]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。另外,本公开所涉及的数据和信息可以为经用户授权或者经过各方充分授权的数据和信息。
[0042]本申请实施例提供的信用卡用户风险类别识别方法,可以应用于如图1所示的应用环境中。其中,终端101通过网络与服务器102进行通信。数据存储系统可以存储服务器102需要本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信用卡用户风险类别识别方法,其特征在于,所述方法包括:获取信用卡用户的用户信息;通过逐步回归模型和多元逻辑回归模型从所述用户信息中筛选得到多个风险影响因素;将所述多个风险影响因素对应的属性值输入预先构建的决策树模型中进行遍历,获取所述决策树模型输出的所述信用卡用户所属的风险类别。2.根据权利要求1所述的方法,其特征在于,所述将所述多个风险影响因素对应的属性值输入预先构建的决策树模型中进行遍历,得到所述信用卡用户的信用风险值之前,所述方法还包括:获取所述多个影响因素对应的训练样本数据;使用所述训练样本数据对以C4.5为基础结构的决策树模型进行训练,得到所述预先构建的决策树模型。3.根据权利要求2所述的方法,其特征在于,所述使用所述训练样本数据对以C4.5为基础结构的决策树模型进行训练,得到所述预先构建的决策树模型,包括:将训练样本数据集放在父节点上;针对每个父节点,遍历所述父节点上的所述训练样本数据集对应的分割方式,找到最佳分割方式;以所述最佳分割方式中的阈值作为分割点,将所述训练样本数据集分割为多个子数据集,并将所述多个子数据集分别分配到所述父节点对应的子节点上,调整所述以C4.5为基础结构的决策树模型中的模型参数,直到所述子节点上的所述子数据集不能再分割为止,得到所述预先构建的决策树模型。4.根据权利要求1所述的方法,其特征在于,所述逐步回归模型为后退型逐步回归模型;所述通过逐步回归模型和多元逻辑回归模型从所述用户信息中筛选得到多个影响因素,包括:通过所述后退型逐步回归模型从所述用户信息中筛选得到第一变量集合;通过多元逻辑回归模型从所述第一变量集合中筛选得到...

【专利技术属性】
技术研发人员:汪志艺王伟权杨俊勉吴佳文
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1