基于集成学习的互联网金融风控预测方法技术

技术编号:33713784 阅读:36 留言:0更新日期:2022-06-06 08:52
本发明专利技术公开了基于集成学习的互联网金融风控预测方法,涉及金融风控领域,包括S1构建预测模型;S2获取数据集,并进行数据处理;S3处理后的数据集导入预测模型对其进行优化训练,获得最优预测模型;S4待预测数据导入到最优预测模型获得风控预测结果;搭建一种经过优化的Bagging集成学习框架,该框架通过随机分配每个基础模型的训练数据进行训练,再通过每个基础模型的AUC为依据加权融合,得到最终的结果;并集合一种经过优化的Stacking集成学习框架,该框架分为两层,第一层模型为多个基础模型对初始数据集训练后进行预测,第一层模型的预测结果最为第二层模型的训练数据,第二层模型为单一模型将第一层模型的预测结果进行集成后输出最终结果。输出最终结果。输出最终结果。

【技术实现步骤摘要】
基于集成学习的互联网金融风控预测方法


[0001]本专利技术涉及金融风控领域,尤其涉及一种基于集成学习的互联网金融风控 预测方法。

技术介绍

[0002]通过对借贷用户在网购、交易、社交等多方平台的信誉及行为数据进行深 入挖掘和分析,对其在各个平台、场景下产生的数据进行归类、汇总,以大数 据时代为背景,以机器学习方法为手段建立用户违约预测模型,将用户的有效 信息转化为用户的违约概率,更好的把控用户和平台发生借贷交易的风险。
[0003]目前现有的解决方法,包括评分卡模型以及传统的LR、SVM和RF算法对 于违约用户的识别能力不强。

技术实现思路

[0004]本专利技术的目的就在于为了解决上述问题设计了一种基于集成学习的互联网 金融风控预测方法。
[0005]本专利技术通过以下技术方案来实现上述目的:
[0006]基于集成学习的互联网金融风控预测方法,包括:
[0007]S1、构建预测模型,预测模型包括第一层模型和第二层模型,第一层模型 包括至少两个基础模型,第二层模型包括一个基础模型,第一层模型的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于集成学习的互联网金融风控预测方法,其特征在于,包括:S1、构建预测模型,预测模型包括第一层模型和第二层模型,第一层模型包括k个基础模型,第二层模型包括一个基础模型,第一层模型的输出作为第二层模型的输入;S2、获取数据集,并对数据集进行数据处理;S3、处理后的数据集导入预测模型对其进行优化训练,获得最优预测模型;S4、待预测数据导入到最优预测模型获得风控预测结果。2.根据权利要求1所述的基于集成学习的互联网金融风控预测方法,其特征在于,在S1中,k不小于2,第一层模型的基础模型各不相同。3.根据权利要求1所述的基于集成学习的互联网金融风控预测方法,其特征在于,在S2中进行数据处理包括:S21、采用特殊空字符串处理、常量列清理、重复列清理、非法值替换和异常值清理对数据集进行分析处理;S22、将分析处理后的数据集分为连续性数据和离散性数据;S23、对离散性数据进行独热编码(one

hot),对连续性数据进行归一化处理,形成处理后的数据集D;S24、将数据集D划分为多份数据,数据的数量等于第一层模型中基础模型的数量k。4.根据权利要求3所述的基于集成学习的互联网金融风控预测方法,其特征在于,在S3中包括:S31、处理后的数据集导入第一层模型,获得第一层模型中每个基础模型的预测结果的集合表示为S32、根据第一层模型中每个基础模的预测结果的集合确定第一层模型的第一预测结果;S33、计算第一层模型的误差,基础模型的损失函数为其中p
i
为基础模型对第i条数据的预测结果,y
i
为第i条数据的真实标签值,并以AUC(Area under the Curve of ROC)作为模型性能的衡量指标优化第一层模型的基础模型;S34、第一预测结果导入第二层模型进行训练优化,获得最优预测模型。5.根据权利要求4所述的基...

【专利技术属性】
技术研发人员:岳钧李开恒王正宁周钊聿周乐瑶
申请(专利权)人:四川省自然资源科学研究院四川省生产力促进中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1