用户违约预测方法、装置及电子设备制造方法及图纸

技术编号:24252373 阅读:26 留言:0更新日期:2020-05-22 23:59
本公开涉及一种用户违约预测方法、装置、电子设备及计算机可读介质。该方法包括:获取用户的金融数据,所述金融数据中包括多个类别的特征数据;将所述金融数据进行字符转化,生成用户数据;以及通过所述用户数据和用户违约预测模型生成所述用户的违约类别和违约概率,所述用户违约预测模型通过分布式梯度提升决策树模型训练获得。本公开涉及的用户违约预测方法、装置、电子设备及计算机可读介质,能够节省了模型训练和计算时间、节省模型的网格搜索的时间、提高用户违约预测的效率和准确度。

Methods, devices and electronic equipment for user default prediction

【技术实现步骤摘要】
用户违约预测方法、装置及电子设备
本公开涉及计算机信息处理领域,具体而言,涉及一种用户违约预测方法、装置、电子设备及计算机可读介质。
技术介绍
通常情况下机器学习模型需要对正样本和负样本进行学习,正样本是正确分类出的类别所对应的样本,负样本原则上可以选取任何不是正确类别的其他样本。机器学习模型根据正负样本建立特定的任务,然后通过特定的数据来对机器学习进行训练,在训练结束后,得到适用于某一个特定任务的机器学习模型。目前已有的对用户进行违约风险分析的方法,大部分是基于决策树的方法,比如GBDT(GradientBoostingDecisionTree),基本都是基于预排序的方法(pre-sorted)的决策树算法,这类决策树的算法需要保存数据的特征值,还需要保存了特征排序的结果,例如排序后的索引,为了后续快速的计算分割点,这样的做法生成的风险分析模型需要消耗训练数据两倍的内存。其次,这样的做法生成的风险分析模型在计算时间上也有较大的开销,在遍历每一个分割点的时候,都需要进行分裂增益的计算,消耗的代价大。而随着金融服务平台上服务的用户越来越多本文档来自技高网...

【技术保护点】
1.一种用户违约预测方法,其特征在于,包括:/n获取用户的金融数据,所述金融数据中包括多个类别的特征数据;/n将所述金融数据进行字符转化,生成用户数据;以及/n通过所述用户数据和用户违约预测模型生成所述用户的违约类别和违约概率,所述用户违约预测模型通过分布式梯度提升决策树模型训练获得。/n

【技术特征摘要】
1.一种用户违约预测方法,其特征在于,包括:
获取用户的金融数据,所述金融数据中包括多个类别的特征数据;
将所述金融数据进行字符转化,生成用户数据;以及
通过所述用户数据和用户违约预测模型生成所述用户的违约类别和违约概率,所述用户违约预测模型通过分布式梯度提升决策树模型训练获得。


2.如权利要求1所述的方法,其特征在于,还包括:
获取历史用户的金融数据和信用数据;
将所述金融数据进行字符转化,生成历史用户数据;
根据所述信用数据为所述历史用户数据确定标签;以及
通过带有标签的历史用户数据对分布式梯度提升决策树模型进行训练,生成所述用户违约预测模型。


3.如权利要求1-2所述的方法,其特征在于,将所述金融数据进行字符转化,包括:
将所述金融数据中的字符型数据转化为整数型数据。


4.如权利要求1-3所述的方法,其特征在于,将所述金融数据进行字符转化,还包括:
声明整数型数据的字段名。


5.如权利要求1-4所述的方法,其特征在于,根据所述信用数据为所述历史用户数据确定标签,包括:
获取所述信用数据中的信用类别标签和违约标签;
根据所述信用类别标签为所述历史用户数据确定类别标签;以及
根据所述违约标签为所述历史用户数据确定违约标签。


6.如权利要求1-5所述的方法,其特征在于,通过带有标签的历史用户数据对分布式梯度提升决策树模型进行训...

【专利技术属性】
技术研发人员:于晓栋
申请(专利权)人:北京淇瑀信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1