消费金融机器学习快速建模的方法和装置制造方法及图纸

技术编号:32973132 阅读:74 留言:0更新日期:2022-04-09 11:44
本发明专利技术属于消费金融领域,具体涉及消费金融机器学习快速建模的方法和装置,整合了数据读取、数据处理、数据统计分析及变量筛选、模型及评分生成、模型融合、模型评价、模型输出七大模块;本发明专利技术通过标准化流程及内嵌算法,降低了建模门槛,缩短了建模用时;通过标准化流程及内嵌算法,将建模过程中部分步骤通过更科学的方法来进行判断,避免了人工操作带来的影响;通过递归式变量筛选、基于算法的自动化分箱、基于KS的模型加权融合以及多评价指标融合,使得最终模型更能表现数据,具备更好的区分力与稳定性。分力与稳定性。

【技术实现步骤摘要】
消费金融机器学习快速建模的方法和装置


[0001]本专利技术属于消费金融领域,具体涉及消费金融机器学习快速建模的方法和装置。

技术介绍

[0002]自2009年《消费金融公司试点管理方法》颁布以来,消费金融蓬勃发展。线上消费金融不同于传统金融信贷,其具有客户流量大、风险因素丰富。欺诈种类多样、业务变化快等特性。贷前、贷中、贷后的风控以及日常营销中,往往面临着数据维度多、模型需求紧急、模型迭代速度要求提升等问题。而传统基于经验的评分卡大多基于人工经验进行筛选变量,引入了主观因素,可能无法筛选出统计意义上的最优变量;且在分箱过程中,手动分箱需要大量的人工判断及操作,使得建模过程复杂化,冗长化,无法适应需要快速迭代模型的线上消费金融场景。而基于机器学习及深度学习的模型,大多只考量模型的区分能力,没有考虑到模型在实际应用当中的概率/分数划分,评分分布非正态,导致cut

off无法使用。
[0003]通常在传统消费金融中,变量筛选大多基于人工经验或仅靠IV值筛选,过程冗长且效果较差;分箱大多基于等频、等距分箱,无法准确表达原有本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.消费金融机器学习快速建模的方法,其特征在于,包括以下步骤:步骤1:数据读取:读取建模所需的相关数据,自适应生成读取函数,解码,将解码后的数据文件读入内存等待处理;步骤2:数据类别转化处理:对内存里的数据文件进行处理,将类别型变量通过目标Y值浓度进行映射,具体映射过程为:对单个类别型变量内每个类别进行如下操作,对单个类别进行计算,将T作为该变量该类别的数值:步骤3:数据离群值处理:对原数值型变量与经过转化后的字符型变量进行离群值检测,对于单个变量,如果值满足|x
i

x|>3*S,其中则判定该值为离群值,对该离群值进行均值替换或对所在样本进行剔除;步骤4:数据相关性计算:对进行离群值处理后的数据进行相关性计算,绘制变量相关性热图矩阵,对变量间相关性极高的样本进行剔除,使用固定值对缺失值进行填充;步骤5:数据统计分析及变量筛选:对处理后的数据计算IV值,剔除IV值小于0.02的变量,对剩余变量采用递归消元进行变量筛选;步骤6:变量分箱:对筛选后的变量进行分箱;步骤7:模型融合:将分箱后的变量进行入模,分别使用Logistic Regression逻辑回归与其他算法对数据进行训练,得到模型A与模型B,分别计算模型的KS值,根据KS值对模型进行加权融合;步骤8:模型评价:分别对步骤7中的模型A、模型B与模型C计算模型的KS值、ROC指数与PSI指数;其中TP为真实为1且预测为1的数目,FN为真实为1且预测为0的数目,FP为真实为0的且预测为1的数目,TN为真实为0的且预测为0的数目;其中A代表训练集单箱占比,B代表测试集单箱占比;将KS值、ROC指数与PSI指数三个评价指标进行融合,计算公式为EVA=(0.5*KS+0.5*ROC)*10

...

【专利技术属性】
技术研发人员:苗琛李文超温子萱卫兴榛郭星宇
申请(专利权)人:晋商消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1