一种基于蒙特卡罗搜索的信用评分卡特征选择方法技术

技术编号:19345233 阅读:41 留言:0更新日期:2018-11-07 15:02
本发明专利技术公开了一种基于蒙特卡罗搜索的信用评分卡特征选择方法,包括:在信用风险评级场景,获得信用评分特征数据;初始化蒙特卡罗搜索树;选择未被完全扩展节点,使用偏回归平方和指标进行复合策略扩展;在扩展后的树结构基础上,在随机模拟策略中引入偏回归平方和划定随机选择域,生成模拟路径;基于每一条路径所选择的特征分别使用交叉验证方法进行逻辑回归建模,并计算相关统计量;基于UCB公式选择最佳路径。采用本发明专利技术提出的信用评分卡特征选择方法,可以极大地提升信用评分卡的建模效果,保证信用评分卡的建模特征最优,从根本上自动化信用评分卡构建的特征选择过程,可以广泛应用在信用风险控制领域。

A feature selection method of credit scoring card based on Monte Carlo search

The invention discloses a credit score cartel feature selection method based on Monte Carlo search, which includes: obtaining credit score feature data in credit risk rating scenario; initializing Monte Carlo search tree; selecting nodes that are not fully expanded, using partial regression square sum index to expand the composite strategy; and extending the extended strategy after the extension. On the basis of tree structure, partial regression square sum is introduced into random simulation strategy to delimit random selection domain and generate simulation path; cross-validation method is used to build logistic regression model based on the selected features of each path, and relevant statistics are calculated; and the optimal path is selected based on UCB formula. By adopting the method of credit scoring cartel feature selection proposed by the invention, the modeling effect of the credit scoring card can be greatly improved, the modeling characteristics of the credit scoring card can be guaranteed to be optimal, and the feature selection process of the construction of the credit scoring card can be fundamentally automated, which can be widely used in the field of credit risk control.

【技术实现步骤摘要】
一种基于蒙特卡罗搜索的信用评分卡特征选择方法
本专利技术属于信用风险控制领域,涉及一种基于蒙特卡罗搜索的信用评分卡特征选择方法。
技术介绍
信用评分卡是指根据客户的各种历史信用资料,用于决定是否给予客户授信和授信额度、利率的模型,典型的信用评分卡如下。随着互联网金融地快速发展,信贷业务也极大地扩张,也带来了一些负面的影响,亟待有效的信用评分卡构建方法降低相关业务的风险。评分卡案例传统的信用评分卡的构建,包括特征工程、分箱、证据权重变换、特征选择、共线性检验、模型训练等过程,其中特征选择过程作为建模数据来源,决定了模型效果的上限。传统的特征选择方法,包括逐步回归、强制回归等根据F检验的显著性反馈筛选特征,搜索空间简单,而且需要较多的人工干预,难以自动化地得到最优的训练结果。
技术实现思路
本专利技术的目的是提供一种基于蒙特卡罗搜索的信用评分卡特征选择方法,以解决现有信用评分卡构建特征选择过程中的搜索空间简单、需要较多人工干预、难以在实际应用中自动化地取得良好效果的问题。该方法将经过分箱、WOE转化后的用户历史信用特征统计量作为输入(如:逾期率,月工资收入,未偿还贷款等),输出为在输入特征中本文档来自技高网...

【技术保护点】
1.一种基于蒙特卡罗搜索的信用评分卡特征选择方法,其特征在于,该方法包括以下步骤:(1)在信用风险评级场景,获得信用评分特征数据;每位用户的信用评分特征记为X{x1,x2,x3,…xn},其中n为初始信用评分特征数量;(2)初始化蒙特卡罗搜索树:创建根节点,设其访问次数为0,此时根节点为最佳路径,将根节点的候选特征集P初始化为步骤(1)中得到的集合X;(3)基于当前的蒙特卡罗搜索树,选择未被完全扩展的节点,使用偏回归平方和最大的N个候选特征作为节点的扩展域,缩小搜索空间后,再进行节点扩展;(4)在步骤(3)扩展后的树结构基础上,在随机模拟策略中,引入偏回归平方和划定随机选择域,生成模拟路径;(...

【技术特征摘要】
1.一种基于蒙特卡罗搜索的信用评分卡特征选择方法,其特征在于,该方法包括以下步骤:(1)在信用风险评级场景,获得信用评分特征数据;每位用户的信用评分特征记为X{x1,x2,x3,…xn},其中n为初始信用评分特征数量;(2)初始化蒙特卡罗搜索树:创建根节点,设其访问次数为0,此时根节点为最佳路径,将根节点的候选特征集P初始化为步骤(1)中得到的集合X;(3)基于当前的蒙特卡罗搜索树,选择未被完全扩展的节点,使用偏回归平方和最大的N个候选特征作为节点的扩展域,缩小搜索空间后,再进行节点扩展;(4)在步骤(3)扩展后的树结构基础上,在随机模拟策略中,引入偏回归平方和划定随机选择域,生成模拟路径;(5)在步骤(4)生成的树结构基础上,遍历树结构的每条路径,基于每条路径所选择的特征计算模型评估统计量及各节点的节点访问次数,将相关统计量反向传播到对应路径的各个节点上;(6)根据树结构使用UCB公式计算并比较各个节点的score值,将score值最大的节点作为该层的最优节点,逐层选择层最优节点,形成最佳路径;(7)重复步骤(3)-(6)直到达到预期搜索次数或最佳路径上所有节点均扩展完全,产出最优特征组合。2.根据权利要求1所述的一种基于蒙特卡罗搜索的信用评分卡特征选择方法,其特征在于,所述步骤(1)中,基于用户信用历史信息资料,按照传统信用评分卡生成流程,进行预处理、特征工程操作,产出信用评分特征数据。3.根据权利要求1所述的一种基于蒙特卡罗搜索的信用评分卡特征选择方法,其特征在于,所述步骤(3)具体为:选择最佳路径上第一个未被完全扩展的节点S,其中路径方向为从根节点到叶节点,若该节点为搜索树根节点,则添加n个子节点,这n个子节点分别代表n个候选特征,否则计算该节点下一层所能扩展的所有候选特征的偏回归平方和U{u1,u2,u3,…ut},在集合U中选择最大的前N个候选特征作为该叶节点的子节点记为A{a1,a2,a3,…aN},若候选特征数小于N则选择全部候选特征;将节点S的候选特征集P除去ai所表示的特征,作为新添节点ai的候选特征集;最终生成一个对于节点S扩展完全的蒙特卡罗搜索树结构。4.根据权利要求1所述的一种基于蒙特卡罗搜索的信用评分卡特征选择方法,其特征在于,所述步骤(3)中,偏回归平方和u的计算公式如下:其中i为引入...

【专利技术属性】
技术研发人员:高杨唐迪佳孙斌杰王新根鲁萍黄滔
申请(专利权)人:浙江邦盛科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1