一种评分卡的融合方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:26600600 阅读:32 留言:0更新日期:2020-12-04 21:23
本发明专利技术公开一种评分卡的融合方法、装置、计算机设备及存储介质,属于风险控制技术领域。方法包括:获取专家评分卡和机器学习评分卡,其中,专家评分卡使用的特征变量和机器学习评分卡所使用的特征变量不同;对专家评分卡与机器学习评分卡在多个权重组合上分别进行融合,得到多个融合评分卡;使用验证样本对多个融合评分卡进行验证,筛选出最优的融合评分卡。相比于现有技术直接将专家挑选的变量加入机器学习模型,重复这个过程直到选出符合模型条件的变量,本发明专利技术不但能够避免重复工作量较大的问题,而且能够有效避免样本数据偏差问题,提升了模型预测能力。

【技术实现步骤摘要】
一种评分卡的融合方法、装置、计算机设备及存储介质
本专利技术涉及风险控制
,尤其涉及一种评分卡的融合方法、装置、计算机设备及存储介质。
技术介绍
在风险控制
中,以金融领域的信贷风险控制为例,金融机构通常需要构建风控模型对业务对象进行信用风险评测,在针对业务对象进行信用风险评测时,可以在风控模型中使用评分卡对业务对象进行信用评分,评分越高,对应的信用风险越低,反之亦然。评分卡可以分为专家评分卡和机器评分卡,在产品积累了大量样本数据的情形下,可以直接使用机器学习建模。但在产品没有足够的数据量建模,或者新的产品没有数据积累时(无监督学习),通常会选择使用专家评分卡。无论是机器学习评分卡还是专家卡,它们在单独使用时都有一定的局限性。机器学习对数据依赖性非常强,一旦样本发生偏差,那么会直接影响到模型的预测能力,同时,建模数据通常具有滞后性,不能对近期的策略和前端业务调整作出及时的反应,模型上线后对当前的客户预测能力会比建模时下降。专家评分卡在一定程度上解决了数据的问题,并且可解释性较强,对于字符型字段和非连续型数值字段的处理更加简单本文档来自技高网...

【技术保护点】
1.一种评分卡的融合方法,其特征在于,所述方法包括:/n获取专家评分卡和机器学习评分卡,其中,所述专家评分卡使用的特征变量和所述机器学习评分卡所使用的特征变量不同;/n对所述专家评分卡与所述机器学习评分卡在多个权重组合上分别进行融合,得到多个融合评分卡;/n使用验证样本对多个所述融合评分卡进行验证,筛选出最优的融合评分卡。/n

【技术特征摘要】
1.一种评分卡的融合方法,其特征在于,所述方法包括:
获取专家评分卡和机器学习评分卡,其中,所述专家评分卡使用的特征变量和所述机器学习评分卡所使用的特征变量不同;
对所述专家评分卡与所述机器学习评分卡在多个权重组合上分别进行融合,得到多个融合评分卡;
使用验证样本对多个所述融合评分卡进行验证,筛选出最优的融合评分卡。


2.根据权利要求1所述的方法,其特征在于,所述获取专家评分卡和机器学习评分卡,包括:
构建训练样本集和特征变量库,所述训练样本集包括正样本和负样本;
根据专家经验法从所述特征变量库中筛选多个特征变量以创建专家评分卡;
从所述特征变量库中剔除筛选出的所有所述特征变量,得到剩余特征变量;
根据所述剩余特征变量在所述训练样本集上进行机器学习,以创建机器学习评分卡。


3.根据权利要求2所述的方法,其特征在于,从所述特征变量库中剔除筛选出的所有所述特征变量,得到剩余特征变量步骤之后,所述方法还包括:
对筛选出的所有所述特征变量与每一个所述剩余特征变量进行相关性检验;
根据相关性检验结果,在所述剩余特征变量中剔除与筛选出的所述特征变量相关的特征变量,以形成用于构建机器学习评分卡的特征变量集;
所述根据所述剩余特征变量在所述训练样本集上进行机器学习,以创建机器学习评分卡,包括:
根据所述特征变量集在所述训练样本集上进行机器学习,构建得到机器学习评分卡。


4.根据权利要求1至3任一所述的方法,其特征在于,每个所述权重组合包括所述专家评分卡对应的第一权重以及所述机器学习评分卡对应的第二权重,多个所述权重组合中的所述第一权重的数值以预定步长依次递减,所述第二权重的数值以预定步长依次递增,且同一个权重组合中的所述第一权重的数值和所述第二权重的数值之和为1。


5.根据权利要求4所述的方法,其特征在于,所述使用验证样本对多个所述融合评分卡进行验证,筛选出最优的融合评分卡,包括:
将所述验证...

【专利技术属性】
技术研发人员:黄馨李怡文
申请(专利权)人:苏宁金融科技南京有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1