决策树和逻辑回归的信用评分卡开发、评分方法和装置制造方法及图纸

技术编号：41228524 阅读：2 留言：0更新日期：2024-05-09 23:45

本公开提供一种决策树和逻辑回归的信用评分卡开发、评分方法和装置，包括：获取第一训练样本集；将第一训练样本集输入预先训练好的风险决策树中，基于风险决策树的输出结果确定每个决策特征项对应的风险等级；获取第二训练样本集；基于第二训练样本集训练得到逻辑回归模型；基于多个决策特征项对应的风险等级，确定原始评分卡的目标分箱，并基于逻辑回归模型和每个目标分箱中变量对应的woe值和iv值，确定每个目标分箱对应的量化分数，以得到基于决策树和逻辑回归的复合信用评分卡。从而，效提升评分卡的信用评分准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本公开的实施例涉及金融行业评分卡模型开发，具体地，涉及适用于一种决策树和逻辑回归的信用评分卡开发、评分方法和装置。

技术介绍

1、评分卡模型为常用的金融风控手段之一。风控，即风险控制，通过采取各种措施和方法，减少风险发生的可能性，或风险发生时造成的损失。

2、传统的评分卡模型通过获取某一时间段内的汇总数据，譬如近半年的逾期均值、近三个月的逾期总额等，并通过将与预测值相关的时间序列衍生特征投入回归模型训练得出。然而，此过程极其容易产生变量的多重共线性，导致评分卡参数不能准确体现变量的真实影响力，降低评分卡的信用评分准确率。

技术实现思路

1、本文中描述的实施例提供了一种决策树和逻辑回归的信用评分卡开发、评分方法和装置，克服了上述问题。

2、第一方面，根据本公开的内容，提供了一种决策树和逻辑回归的信用评分卡开发方法，包括：

3、获取第一训练样本集，所述第一训练样本集中包括多个决策特征项，多个所述决策特征项用于描述企业训练样本或个人训练样本；

4、将所述第一训练样本集输入预先训练好的风险决策树中，基于所述风险决策树的输出结果确定每个所述决策特征项对应的风险等级，所述风险决策树用于预测企业贷款风险等级或个人贷款风险等级；

5、获取第二训练样本集，所述第二训练样本集由多个所述决策特征项对应的风险等级以及与所述第一训练样本集关联的其它样本集确定得出；

6、基于所述第二训练样本集训练得到逻辑回归模型，所述逻辑回归模型用于预测

7、基于多个所述决策特征项对应的风险等级，确定原始评分卡的目标分箱，并基于所述逻辑回归模型和每个所述目标分箱中变量对应的woe值和iv值，确定每个所述目标分箱对应的量化分数，以得到基于决策树和逻辑回归的复合信用评分卡。

8、第二方面，根据本公开的内容，提供了一种信用评分方法，包括：

9、获取待检测数据，所述待检测数据包括：企业检测数据或个人检测数据；

10、将所述待检测数据输入基于决策树和逻辑回归的复合信用评分卡中，基于所述复合信用评分卡的输出结果确定对应的第一信用评分；

11、将所述待检测数据输入其它信用评分卡中，基于所述其它信用评分卡的输出结果确定对应的第二信用评分；

12、基于所述第一信用评分和所述第二信用评分，确定所述待检测数据对应的评分结果；

13、其中，所述复合信用评分卡是基于第一方面所述的决策树和逻辑回归的信用评分卡开发方法所训练得到的。

14、第三方面，根据本公开的内容，提供了一种决策树和逻辑回归的信用评分卡开发装置，包括：

15、第一获取模块，用于获取第一训练样本集，所述第一训练样本集中包括多个决策特征项，多个所述决策特征项用于描述企业训练样本或个人训练样本；

16、第一输入模块，用于将所述第一训练样本集输入预先训练好的风险决策树中，基于所述风险决策树的输出结果确定每个所述决策特征项对应的风险等级，所述风险决策树用于预测企业贷款风险等级或个人贷款风险等级；

17、第二获取模块，用于获取第二训练样本集，所述第二训练样本集由多个所述决策特征项对应的风险等级以及与所述第一训练样本集关联的其它样本集确定得出；

18、训练模块，用于基于所述第二训练样本集训练得到逻辑回归模型，所述逻辑回归模型用于预测企业贷款违约概率或个人贷款违约概率；

19、第一确定模块，用于基于多个所述决策特征项对应的风险等级，确定原始评分卡的目标分箱，并基于所述逻辑回归模型和每个所述目标分箱中变量对应的woe值和iv值，确定每个所述目标分箱对应的量化分数，以得到基于决策树和逻辑回归的复合信用评分卡。

20、第四方面，根据本公开的内容，提供了一种信用评分装置，其特征在于，包括：

21、第三获取模块，用于获取待检测数据，所述待检测数据包括：企业检测数据或个人检测数据；

22、第二输入模块，用于将所述待检测数据输入基于决策树和逻辑回归的复合信用评分卡中，基于所述复合信用评分卡的输出结果确定对应的第一信用评分；

23、第三输入模块，用于将所述待检测数据输入其它信用评分卡中，基于所述其它信用评分卡的输出结果确定对应的第二信用评分；

24、第二确定模块，用于基于所述第一信用评分和所述第二信用评分，确定所述待检测数据对应的评分结果；

25、其中，所述复合信用评分卡是基于第一方面所述的决策树和逻辑回归的信用评分卡开发方法所训练得到的。

26、第五方面，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，处理器执行计算机程序时实现如以上任意一个实施例中决策树和逻辑回归的信用评分卡开发方法的步骤，或者实现如以上任意一个实施例中信用评分方法的步骤。

27、第六方面，提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现如以上任意一个实施例中决策树和逻辑回归的信用评分卡开发方法的步骤，或者实现如以上任意一个实施例中决信用评分方法的步骤。

28、本申请实施例提供的决策树和逻辑回归的信用评分卡开发方法，获取第一训练样本集，第一训练样本集中包括多个决策特征项，多个决策特征项用于描述企业训练样本或个人训练样本；将第一训练样本集输入预先训练好的风险决策树中，基于风险决策树的输出结果确定每个决策特征项对应的风险等级，风险决策树用于预测企业贷款风险等级或个人贷款风险等级；获取第二训练样本集，第二训练样本集由多个决策特征项对应的风险等级以及与第一训练样本集关联的其它样本集确定得出；基于第二训练样本集训练得到逻辑回归模型，逻辑回归模型用于预测企业贷款违约概率或个人贷款违约概率；基于多个决策特征项对应的风险等级，确定原始评分卡的目标分箱，并基于逻辑回归模型和每个目标分箱中变量对应的woe值和iv值，确定每个目标分箱对应的量化分数，以得到基于决策树和逻辑回归的复合信用评分卡。如此，通过决策树风险模型训练彼此相关的特征项，得到多个风险级别，再将风险级别输入逻辑回归模型中，并采用区分后的不同风险等级做数据分箱，确定出基于决策树和逻辑回归的复合信用评分卡，减少了具有多重共线性的变量导致数据过拟合的程度，同时，减少了异常值、极端值对回归模型带来的影响，提高模型稳定性，有效提升评分卡的信用评分准确率。

29、上述说明仅是本申请实施例技术方案的概述，为了能够更清楚了解本申请实施例的技术手段，而可依照说明书的内容予以实施，并且为了让本申请实施例的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

本文档来自技高网...

【技术保护点】

1.一种决策树和逻辑回归的信用评分卡开发方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述逻辑回归模型和每个所述目标分箱中变量对应的woe值和iv值，确定每个所述目标分箱对应的量化分数，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于多个所述决策特征项对应的风险等级，确定原始评分卡的目标分箱，包括：

4.根据权利要求2所述的方法，其特征在于，所述基于所述逻辑回归模型中每个输出项对应的系数、每个所述目标分箱中变量对应的woe值以及iv值，进行分数映射，得到每个所述目标分箱对应的量化分数，包括：

5.根据权利要求1所述的方法，其特征在于，所述获取第二训练样本集，包括：

6.根据权利要求1所述的方法，其特征在于，所述风险决策树的训练过程为：

7.根据权利要求1所述的方法，其特征在于，所述企业训练样本包括：企业逾期总金额、企业逾期金额均值、企业逾期处罚金额、企业逾期次数和企业逾期处罚次数；

8.一种信用评分方法，其特征在于，包括：

9.一种决策树和逻辑回

10.一种信用评分装置，其特征在于，包括：

...

【技术特征摘要】

1.一种决策树和逻辑回归的信用评分卡开发方法，其特征在于，包括：

3.根据权利要求1所述的方法，其特征在于，所述基于多个所述决策特征项对应的风险等级，确定原始评分卡的目标分箱，包括：

4.根据权利要求2所述的方法，其特征在于，所述基于所述逻辑回归模型中每个输出项对应的系数、每个所述目标分箱中变量对应的woe值以及iv值，进行分数映射，得到每个所述目标...

【专利技术属性】
技术研发人员：王锦胤，王欢，史延莹，
申请(专利权)人：紫金诚征信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人