一种特征离散化技术对个人用户信用风险的识别方法技术

技术编号:31508501 阅读:26 留言:0更新日期:2021-12-22 23:43
本发明专利技术公开了一种特征离散化技术对个人用户信用风险的识别方法,属于建模特征处理技术及风控技术领域,解决了传统的逻辑回归应用在个人信用风险模型时,由于数据不均匀分布导致模型缺陷的问题。本发明专利技术包括:提取历史客户征信数据作为建模样本;建模特征离散化;识别黏连指标并进行特征分解;使用特征分解后的指标族训练逻辑回归模型;将模型用于线上客户违约概率预测。约概率预测。

【技术实现步骤摘要】
一种特征离散化技术对个人用户信用风险的识别方法


[0001]一种特征离散化技术对个人用户信用风险的识别方法,用于个人用户信用风险的识别,属于模型特征优化技术及风控


技术介绍

[0002]逻辑回归核心思想是用Logit函数对概率进行转换,Logit函数公式:
[0003]Logit(x)=ln(x/(1

x))
[0004]假设逻辑回归模型自变量为Y,因变量为A、B.在常规的指标离散化环节,我们会对变量A、B进行WOE变换,转换函数WOE
A
、WOE
B
具体公式如下:
[0005]WOE
A
(x)=Logit(P(Y=1))

Logit(P(Y=1:x∈x
A
))
[0006]WOE
B
(x)=Logit(P(Y=1))

Logit(P(Y=1:x∈x
B
))
[0007]均匀样本下指标WOE
A
>(x)和WOE...

【技术保护点】

【技术特征摘要】
1.一种特征离散化技术对个人用户信用风险的识别方法,其特征在于,包括:步骤1、提取历史客户征信数据并进行标签标记,其中,标签包括正常还款客户和违约客户,历史客户征信数据包括借贷行和基础信息,借贷行为包括信用卡数指标和贷款笔数指标,基础信息包括年龄指标;步骤2、基于历史客户征信数据中的各指标结合标签标记计算各指标的IV值,再基于业务经验和IV值筛选出IV值较高且符合业务逻辑的指标构成入模指标池,并对入模指标池中的指标进行区间划分以及WOE转换,得到各指标相应的WOE
A
特征,其中,A表示A指标;步骤3、基于各指标的WOE
A
特征获取黏连指标、孤立指标和黏连类,对于黏连指标,获取每个指标的特征作为有效特征,对于孤立指标,获取WOE
A
特征作为有效特征,对于黏连类,获取对应黏连类的黏连边缘特征作为有效特征,其中,表示第k个黏连类Sk的黏连边缘特征;步骤4、将有效特征作为入模变量,使用Logistic方法进行建模,得到最终的违约概率预测模型;步骤5、提取待预测线上客户的征信数据,将征信数据输入违约概率预测模型对待预测的线上客户进行违约概率预测。2.根据权利要求1所述的一种特征离散化技术对个人用户信用风险的识别方法,其特征在于,步骤1的具体步骤为:获取xml格式的历史客户征信数据,其中,历史客户征信数据包括的指标数为2000个以上;将xml格式的历史客户征信数据结构化;将结构化后的历史客户征信数据以数据库或文件的形式进行存储;基于存储的结构化后的历史客户征信数据所对应的各历史客户在商业银行中的违约记录,对结构化后的历史客户征信数据进行正常还款客户和违约客户标签标记。3.根据权利要求1所述的一种特征离散化技术对个人用户信用风险的识别方法,其特征在于,步骤3的具体步骤为:步骤3.1、基于WOE分解算法将各指标的WOE
A
特征拆解为和两个特征;步骤3.2、计算各指标的特征的pearson相关系数矩阵并基于pearson相关系数矩阵将指标划分为孤立指标和黏连指标;步骤3.3、基于pearson相关系数矩阵构造黏连指标之间的距离函数,并依据距离函数使用层次聚类算法对黏连指标进行聚类,聚类后得到多个黏连类,再基于各黏连类得到与黏连类相对应的黏连边缘特征步骤3.4、对于黏连指标,取每个指标的特征作为有效特征,对于孤立指标,取WOE
A
特征作为有效特征,对于黏连类,取黏连类相对应的黏连边缘特征作为有效特征。4.根据权利要求3所述的一种特征离散化...

【专利技术属性】
技术研发人员:李诗宇田羽兰翔陈刚陈如校
申请(专利权)人:武汉众邦银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1