金融风险评估模型训练方法及装置、金融风险评估方法制造方法及图纸

技术编号:35579583 阅读:16 留言:0更新日期:2022-11-12 16:06
本申请提供一种金融风险评估模型训练方法及装置、金融风险评估方法,本申请中,首先从金融风险评估模型在实际使用中产生的真实拒绝的样本数据集中进行随机取样,以形成当前迭代周期的真实拒绝样本数据集。然后,对真实拒绝样本数据集中的各个拒绝样本添加标签,并基于当前迭代周期的正样本数据集、负样本数据集、建模拒绝样本数据集以及真实拒绝样本数据集,对金融风险评估模型进行模型训练以得到更新后的金融风险评估模型。如此,能够有效解决样本偏差问题,并能够有效提高金融风险评估模型的训练可靠性及效率,进而能够有效提高基于金融风险评估模型进行金融风险评估的准确性,提高根据评估结果对金融客户进行风险控制的可靠性及有效性。可靠性及有效性。可靠性及有效性。

【技术实现步骤摘要】
金融风险评估模型训练方法及装置、金融风险评估方法


[0001]本申请涉及人工智能相关
,具体而言,涉及一种金融风险评估模型训练方法及装置、金融风险评估方法。

技术介绍

[0002]在如金融风险预测等需要进行风险控制的场景中,机器学习已经成为了重要手段之一。以贷款违约风险评估为例,可以构建模型对贷款申请者的违约风险进行预测,并给出申请者违约概率,使得金融借贷机构可以参考预测结果做出是否对该申请者进行如拒绝贷款申请等的风险控制决策。而为了保证金融风险预测的准确性,需要解决风险控制中的样本偏差(例如:幸存者偏差)问题。
[0003]目前,在金融风险预测过程中,为了解决样本偏差问题,现有的一种解决方案是拒绝推断,也叫拒绝演绎,即为拒绝样本添加伪标记和权重,具体方式是根据现有的模型对上一代模型的拒绝样本打分,得到拒绝样本的违约概率,例如某客户预测出坏账概率为0.8,则按照4:1的权重分别生成两种标签的样本带入模型训练。然而,拒绝推断是建立模型在拒绝样本上有效的假设上,因此拒绝推断法虽然可以带来部分增益,但效果往往会因为模型在拒绝客群上效果不佳而导致最终的解决样本偏差的效果不及预期;其次,拒绝推断的效果取决于总体负样本占比,但得到总体负样本占比很难,也会影响模型训练效率。
[0004]也就是说,由于无法更好的解决样本偏差问题,现有的金融风险预测过程中依然存在模型训练效率低且预测准确性差等问题。

技术实现思路

[0005]为了克服现有技术中的上述不足,本申请的目的在于提供一种金融风险评估模型训练方法及装置、金融风险评估方法,能够有效解决样本偏差问题,并能够有效提高金融风险评估模型的训练可靠性及效率,进而能够有效提高基于金融风险评估模型进行金融风险评估的准确性,提高根据评估结果对金融客户进行风险控制的可靠性及有效性。
[0006]为解决上述技术问题,本申请提供以下技术方案:
[0007]第一方面,本申请提供一种金融风险评估模型训练方法,包括:
[0008]从金融风险评估模型在实际使用中产生的真实拒绝的样本数据集中进行随机取样,以形成当前迭代周期的真实拒绝样本数据集;
[0009]对所述真实拒绝样本数据集中的各个拒绝样本添加标签;
[0010]基于当前迭代周期的正样本数据集、负样本数据集、建模拒绝样本数据集以及所述真实拒绝样本数据集,对所述金融风险评估模型进行模型训练以得到更新后的金融风险评估模型。
[0011]进一步地,所述对所述真实拒绝样本数据集中的各个拒绝样本添加标签,包括:
[0012]采用半监督学习法对所述真实拒绝样本数据集中的各个拒绝样本添加标签。
[0013]进一步地,所述基于当前迭代周期的正样本数据集、负样本数据集、建模拒绝样本
数据集以及所述真实拒绝样本数据集,对所述金融风险评估模型进行模型训练以得到更新后的金融风险评估模型,包括:
[0014]获取当前迭代周期的正样本数据集及负样本数据集,并将该正样本数据集及负样本数据集确定为常规样本数据集;
[0015]基于所述常规样本数据、建模拒绝样本数据集以及所述真实拒绝样本数据集,应用增量学习方式对所述金融风险评估模型进行模型训练,以得到更新后的金融风险评估模型。
[0016]进一步地,所述基于所述常规样本数据、建模拒绝样本数据集以及所述真实拒绝样本数据集,应用增量学习方式对所述金融风险评估模型进行模型训练,以得到更新后的金融风险评估模型,包括:
[0017]基于预设的重要性,对所述常规样本数据、所述建模拒绝样本数据集以及所述真实拒绝样本数据集进行排序,以得到对应的排序结果;
[0018]根据所述排序结果,对排序结果中最靠前的数据集,采用XGBoost算法进行模型训练得到树组A;再使用排序结果中中间的数据集,同样采用XGBoost算法在树组A的基础上继续训练增加新树,得到树组B;最后使用排序结果最靠后的数据集,采用XGBoost算法在树组B的基础上继续训练增加新树,以得到更新后的金融风险评估模型。
[0019]进一步地,在所述对所述金融风险评估模型进行模型训练以得到更新后的金融风险评估模型之前,还包括:
[0020]获取金融风险评估模型的上一次迭代周期中储存的小于拒绝阈值且有真实贷后表现的建模样本数据集,并将该建模样本数据集作为所述金融风险评估模型当前的建模拒绝样本数据集。
[0021]进一步地,还包括:
[0022]设置所述更新后的金融风险评估模型的拒绝阈值;
[0023]在构建所述更新后的金融风险评估模型使用的常规样本数据集中选取小于所述拒绝阈值的样本,作为下次进行模型迭代时的建模拒绝样本数据集。
[0024]第二方面,本申请提供一种金融风险评估模型训练装置,包括:
[0025]数据提取模块,用于从金融风险评估模型在实际使用中产生的真实拒绝的样本数据集中进行随机取样,以形成当前迭代周期的真实拒绝样本数据集;
[0026]标签添加模块,用于对所述真实拒绝样本数据集中的各个拒绝样本添加标签;
[0027]模型训练模块,用于基于当前迭代周期的正样本数据集、负样本数据集、建模拒绝样本数据集以及所述真实拒绝样本数据集,对所述金融风险评估模型进行模型训练以得到更新后的金融风险评估模型。
[0028]第三方面,本申请提供一种金融风险评估方法,包括:
[0029]接收目标金融用户数据;
[0030]将所述目标金融用户数据预处理,以得到目标金融用户的特征数据;
[0031]将所述特征数据输入更新后的金融风险评估模型中,并根据该更新后的金融风险评估模型的输出确定所述目标金融用户的金融风险评估结果,其中,所述更新后的金融风险评估模型预先基于所述的金融风险评估模型训练方法得到;
[0032]输出所述目标金融用户的金融风险评估结果。
[0033]第四方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的金融风险评估模型训练方法,或者,所述处理器执行所述计算机程序时实现所述的金融风险评估方法。
[0034]第五方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的金融风险评估模型训练方法,或者,所述计算机程序被处理器执行时实现所述的金融风险评估方法。
[0035]相对于现有技术而言,本申请实施例从金融风险评估模型在实际使用中产生的真实拒绝的样本数据集中进行随机取样,以形成当前迭代周期的真实拒绝样本数据集。同时,在使用常规样本数据集的基础上,补充了建模拒绝样本数据集与真实拒绝样本数据集对所述金融风险评估模型进行模型训练。此外,由于上一次模型迭代的建模拒绝样本数据集与此次迭代模型的真实拒绝样本数据集都是被上一代模型以同样的拒绝分数阈值拒绝,因此应当具有相同的特征分布。进一步地,由于建模拒绝样本数据集具有真实的标签,能够增加模型对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种金融风险评估模型训练方法,其特征在于,包括:从金融风险评估模型在实际使用中产生的真实拒绝的样本数据集中进行随机取样,以形成当前迭代周期的真实拒绝样本数据集;对所述真实拒绝样本数据集中的各个拒绝样本添加标签;基于当前迭代周期的正样本数据集、负样本数据集、建模拒绝样本数据集以及所述真实拒绝样本数据集,对所述金融风险评估模型进行模型训练以得到更新后的金融风险评估模型。2.根据权利要求1所述的金融风险评估模型训练方法,其特征在于,所述对所述真实拒绝样本数据集中的各个拒绝样本添加标签,包括:采用半监督学习法对所述真实拒绝样本数据集中的各个拒绝样本添加标签。3.根据权利要求1所述的金融风险评估模型训练方法,其特征在于,所述基于当前迭代周期的正样本数据集、负样本数据集、建模拒绝样本数据集以及所述真实拒绝样本数据集,对所述金融风险评估模型进行模型训练以得到更新后的金融风险评估模型,包括:获取当前迭代周期的正样本数据集及负样本数据集,并将该正样本数据集及负样本数据集确定为常规样本数据集;基于所述常规样本数据、建模拒绝样本数据集以及所述真实拒绝样本数据集,应用增量学习方式对所述金融风险评估模型进行模型训练,以得到更新后的金融风险评估模型。4.根据权利要求3所述的金融风险评估模型训练方法,其特征在于,所述基于所述常规样本数据、建模拒绝样本数据集以及所述真实拒绝样本数据集,应用增量学习方式对所述金融风险评估模型进行模型训练,以得到更新后的金融风险评估模型,包括:基于预设的重要性,对所述常规样本数据、所述建模拒绝样本数据集以及所述真实拒绝样本数据集进行排序,以得到对应的排序结果;根据所述排序结果,对排序结果中最靠前的数据集,采用XGBoost算法进行模型训练得到树组A;再使用排序结果中中间的数据集,同样采用XGBoost算法在树组A的基础上继续训练增加新树,得到树组B;最后使用排序结果最靠后的数据集,采用XGBoost算法在树组B的基础上继续训练增加新树,以得到更新后的金融风险评估模型。5.根据权利要求1所述的金融风险评估模型训练方法,其特征在于,在所述对所述金融风险评估模...

【专利技术属性】
技术研发人员:顾凌云周轩乔韵如陶帅王震宇
申请(专利权)人:上海冰鉴信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1