拒客回捞模型训练方法、装置及电子设备制造方法及图纸

技术编号：29838177 阅读：18 留言：0更新日期：2021-08-27 14:28

本申请提供一种拒客回捞模型训练方法、装置及电子设备，所述方法包括：根据用户数据训练样本确定入模变量并输入待训练模型进行处理，获得输出结果；根据样本标签、输出结果及预设的目标函数对待训练模型的模型参数进行调整；待训练模型的损失函数包括表征正样本的损失函数值的第一函数项和表征负样本的损失函数值的第二函数项，第一函数项包括表示正样本被预测为负样本时的第一惩罚系数，第二函数项包括表示负样本被预测为正样本时的第二惩罚系数，第一惩罚系数大于第二惩罚系数。如此，可以使得对将正样本预测为负样本的关注度高于将负样本预测为正样本，从而提高模型对正样本预测的准确度，确保模型在实际使用中回捞客户的风险在可控范围内。

全部详细技术资料下载

【技术实现步骤摘要】
拒客回捞模型训练方法、装置及电子设备
本申请涉及大数据
，具体而言，涉及一种拒客回捞模型训练方法、装置及电子设备。
技术介绍
拒客回捞是近年发展起来的一种风控模式，指的是金融放贷机构在一道风控业务已经拒绝过的客群中，构建新的风控模型进行二道筛选，并在确保风险可控的基础上尽可能回捞部分客户进行放贷。拒客回捞模式能够降低金融放贷机构的获客成本，在稳定风险的基础上进一步提高通过率。在建模思路上，拒客回捞模型与信用评估模型有明显的差异。因为拒客回捞模型需首先确保风险可控，对逾期率的关注高于通过率，所以使用实际业务场景中，对“将正样本预测为负样本”的关注度高于将“将负样本预测为正样本”，因此传统的信用评估模型不适用于拒客回捞场景。
技术实现思路
为了克服现有技术中的上述不足，本申请的目的在于提供一种拒客回捞模型训练方法，其特征在于，所述方法包括：获取包括多个用户数据训练样本，所述用户数据训练样本包括正样本及负样本，所述正样本的样本标签表征不需要回捞的用户，所述负样本的样本标签表征需要回捞的用户；对所述用户数据训练样本进行特征提取和特征筛选，确定入模变量；将所述用户数据训练样本和所述入模变量输入待训练模型进行处理，获得所述用户数据训练样本的输出结果；根据所述用户数据训练样本的样本标签、所述输出结果及预设的目标函数对所述待训练模型的模型参数进行调整；其中，所述待训练模型的损失函数包括表征所有正样本的损失函数值的第一函数项和表征所有负样本的损失函数值的第二函数...

【技术保护点】
1.一种拒客回捞模型训练方法，其特征在于，所述方法包括：/n获取包括多个用户数据训练样本，所述用户数据训练样本包括正样本及负样本，所述正样本的样本标签表征不需要回捞的用户，所述负样本的样本标签表征需要回捞的用户；/n对所述用户数据训练样本进行特征提取和特征筛选，确定入模变量；/n将所述用户数据训练样本和所述入模变量输入待训练模型进行处理，获得所述用户数据训练样本的输出结果；/n根据所述用户数据训练样本的样本标签、所述输出结果及预设的目标函数对所述待训练模型的模型参数进行调整；/n其中，所述待训练模型的损失函数包括表征所有正样本的损失函数值的第一函数项和表征所有负样本的损失函数值的第二函数项，所述第一函数项包括表示正样本被预测为负样本时的第一惩罚系数，所述第二函数项包括表示负样本被预测为正样本时的第二惩罚系数，所述第一惩罚系数大于所述第二惩罚系数。/n

【技术特征摘要】
1.一种拒客回捞模型训练方法，其特征在于，所述方法包括：
获取包括多个用户数据训练样本，所述用户数据训练样本包括正样本及负样本，所述正样本的样本标签表征不需要回捞的用户，所述负样本的样本标签表征需要回捞的用户；
对所述用户数据训练样本进行特征提取和特征筛选，确定入模变量；
将所述用户数据训练样本和所述入模变量输入待训练模型进行处理，获得所述用户数据训练样本的输出结果；
根据所述用户数据训练样本的样本标签、所述输出结果及预设的目标函数对所述待训练模型的模型参数进行调整；
其中，所述待训练模型的损失函数包括表征所有正样本的损失函数值的第一函数项和表征所有负样本的损失函数值的第二函数项，所述第一函数项包括表示正样本被预测为负样本时的第一惩罚系数，所述第二函数项包括表示负样本被预测为正样本时的第二惩罚系数，所述第一惩罚系数大于所述第二惩罚系数。

2.根据权利要求1所述的方法，其特征在于，所述目标函数的公式如下：

其中，yi表示用户数据训练样本i的真实标签，表示用户数据训练样本i的预测标签为正样本的概率；
数据项为所述第一函数项，w0表示所述第一惩罚系数；表示不同正样本计算损失函数值的调制系数，r表示权重调整比例，r≥0；
数据项为所述第二函数项，w1表示所述第二惩罚系数；表示不同负样本计算损失函数值的调制系数，r表示权重调整比例，r≥0。

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：
根据用户数据训练样本中正负样本比例进行设置所述第一惩罚系数、第二惩罚系数及权重调整比例；或
使用所述用户数据训练样本进行网格搜索以确定所述第一惩罚系数、第二惩罚系数及权重调整比例。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：
使用所述用户数据训练样本和所述入模变量，对待训练模型进行多次训练获得不同的已训练模型；其中，每次训练使用的不同的系数进行网格搜索；
通过预设的评价函数计算各所述已训练模型的评价指标值；
将所述评价指标值最高的已训练模型作为训练完成的拒客回捞模型。

5.根据权利要求4所述的方法，其特征在于，所述评价函数的评价指标包括曲线下面积AUC指标或Kolmogorov-Smirnov指标。

6.根据权利要求4所述的方法，...

【专利技术属性】
技术研发人员：顾凌云，谢旻旗，段湾，乔韵如，王震宇，
申请(专利权)人：上海冰鉴信息科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人