拒客回捞模型训练方法、装置及电子设备制造方法及图纸

技术编号:29838177 阅读:18 留言:0更新日期:2021-08-27 14:28
本申请提供一种拒客回捞模型训练方法、装置及电子设备,所述方法包括:根据用户数据训练样本确定入模变量并输入待训练模型进行处理,获得输出结果;根据样本标签、输出结果及预设的目标函数对待训练模型的模型参数进行调整;待训练模型的损失函数包括表征正样本的损失函数值的第一函数项和表征负样本的损失函数值的第二函数项,第一函数项包括表示正样本被预测为负样本时的第一惩罚系数,第二函数项包括表示负样本被预测为正样本时的第二惩罚系数,第一惩罚系数大于第二惩罚系数。如此,可以使得对将正样本预测为负样本的关注度高于将负样本预测为正样本,从而提高模型对正样本预测的准确度,确保模型在实际使用中回捞客户的风险在可控范围内。

【技术实现步骤摘要】
拒客回捞模型训练方法、装置及电子设备
本申请涉及大数据
,具体而言,涉及一种拒客回捞模型训练方法、装置及电子设备。
技术介绍
拒客回捞是近年发展起来的一种风控模式,指的是金融放贷机构在一道风控业务已经拒绝过的客群中,构建新的风控模型进行二道筛选,并在确保风险可控的基础上尽可能回捞部分客户进行放贷。拒客回捞模式能够降低金融放贷机构的获客成本,在稳定风险的基础上进一步提高通过率。在建模思路上,拒客回捞模型与信用评估模型有明显的差异。因为拒客回捞模型需首先确保风险可控,对逾期率的关注高于通过率,所以使用实际业务场景中,对“将正样本预测为负样本”的关注度高于将“将负样本预测为正样本”,因此传统的信用评估模型不适用于拒客回捞场景。
技术实现思路
为了克服现有技术中的上述不足,本申请的目的在于提供一种拒客回捞模型训练方法,其特征在于,所述方法包括:获取包括多个用户数据训练样本,所述用户数据训练样本包括正样本及负样本,所述正样本的样本标签表征不需要回捞的用户,所述负样本的样本标签表征需要回捞的用户;对所述用户数据训练样本进行特征提取和特征筛选,确定入模变量;将所述用户数据训练样本和所述入模变量输入待训练模型进行处理,获得所述用户数据训练样本的输出结果;根据所述用户数据训练样本的样本标签、所述输出结果及预设的目标函数对所述待训练模型的模型参数进行调整;其中,所述待训练模型的损失函数包括表征所有正样本的损失函数值的第一函数项和表征所有负样本的损失函数值的第二函数项,所述第一函数项包括表示正样本被预测为负样本时的第一惩罚系数,所述第二函数项包括表示负样本被预测为正样本时的第二惩罚系数,所述第一惩罚系数大于所述第二惩罚系数。在一种可能的实现方式中,所述目标函数的公式如下:其中,yi表示用户数据训练样本i的真实标签,表示用户数据训练样本i的预测标签为正样本的概率;数据项为所述第一函数项,w0表示所述第一惩罚系数;表示不同正样本计算损失函数值的调制系数,r表示权重调整比例,r≥0;数据项为所述第二函数项,w1表示所述第二惩罚系数;表示不同负样本计算损失函数值的调制系数,r表示权重调整比例,r≥0。在一种可能的实现方式中,所述方法还包括:根据用户数据训练样本中正负样本比例进行设置所述第一惩罚系数、第二惩罚系数及权重调整比例;或使用所述用户数据训练样本进行网格搜索以确定所述第一惩罚系数、第二惩罚系数及权重调整比例。在一种可能的实现方式中,所述方法还包括:使用所述用户数据训练样本和所述入模变量,对待训练模型进行多次训练获得不同的已训练模型;其中,每次训练使用的不同的系数进行网格搜索;通过预设的评价函数计算各所述已训练模型的评价指标值;将所述评价指标值最高的已训练模型作为训练完成的拒客回捞模型。在一种可能的实现方式中,所述评价函数的评价指标包括曲线下面积AUC指标或Kolmogorov-Smirnov指标。在一种可能的实现方式中,所述通过预设的评价函数计算各所述已训练模型的评价指标值的步骤,包括:针对各所述已训练模型,按照各所述用户数据训练样本的输出结果从小到大的顺序对用户数据训练样本排序,选择排名靠前的预设数量个样本通过所述评价函数计算获得评价指标值。本申请还提供一种拒客回捞模型训练装置,所述装置包括:数据获取模块,用于获取包括多个用户数据训练样本,所述用户数据训练样本包括正样本及负样本,所述正样本的样本标签表征不需要回捞的用户,所述负样本的样本标签表征需要回捞的用户;特征处理模块,用于对所述用户数据训练样本进行特征提取和特征筛选,确定入模变量;模型处理模块,用于将所述用户数据训练样本和所述入模变量输入待训练模型进行处理,获得所述用户数据训练样本的输出结果;参数调整模块,用于根据所述用户数据训练样本的样本标签、所述输出结果及预设的目标函数对所述待训练模型的模型参数进行调整;其中,所述待训练模型的损失函数包括表征所有正样本的损失函数值的第一函数项和表征所有负样本的损失函数值的第二函数项,所述第一函数项包括表示正样本被预测为负样本时的第一惩罚系数,所述第二函数项包括表示负样本被预测为正样本时的第二惩罚系数,所述第一惩罚系数大于所述第二惩罚系数。在一种可能的实现方式中,所述目标函数的公式如下:其中,yi表示用户数据训练样本i的真实标签,表示用户数据训练样本i的预测标签为正样本的概率;数据项为所述第一函数项,w0表示所述第一惩罚系数;表示不同正样本计算损失函数值的调制系数,r表示权重调整比例,r≥0;数据项为所述第二函数项,w1表示所述第二惩罚系数;表示不同负样本计算损失函数值的调制系数,r表示权重调整比例,r≥0。在一种可能的实现方式中,所述装置还包括:系数调整模块,用于根据用户数据训练样本中正负样本比例进行设置所述第一惩罚系数、第二惩罚系数及权重调整比例;或使用所述用户数据训练样本进行网格搜索以确定所述第一惩罚系数、第二惩罚系数及权重调整比例。本申请还提供一种电子设备,包括处理器及机器可读存储介质,所述机器可读存储介质存储有机器可执行指令,所述机器可执行指令在被所述处理器执行时,实现本申请提供的拒客回捞模型训练方法。相对于现有技术而言,本申请具有以下有益效果:本申请提供的拒客回捞模型训练方法、装置及电子设备,通过将模型时使用的损失函数设置为包括表征所有正样本的损失函数值的第一函数项和表征所有负样本的损失函数值的第二函数项,所述第一函数项包括表示正样本被预测为负样本时的第一惩罚系数,所述第二函数项包括表示负样本被预测为正样本时的第二惩罚系数,所述第一惩罚系数大于所述第二惩罚系数。提高模型对正样本预测的准确度,提升模型使用效果,确保模型在实际使用中回捞客户的风险在可控范围内。如此,可以使得对“将正样本预测为负样本”的关注度高于“将负样本预测为正样本”,从而提高模型对正样本预测的准确度,提升模型使用效果,确保模型在实际使用中回捞客户的风险在可控范围内。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本申请实施例提供的拒客回捞模型训练方法的步骤流程示意图;图2为本申请实施例提供的电子设备的示意图;图3为本申请实施例提供的拒客回捞模型训练装置的功能模块示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申本文档来自技高网...

【技术保护点】
1.一种拒客回捞模型训练方法,其特征在于,所述方法包括:/n获取包括多个用户数据训练样本,所述用户数据训练样本包括正样本及负样本,所述正样本的样本标签表征不需要回捞的用户,所述负样本的样本标签表征需要回捞的用户;/n对所述用户数据训练样本进行特征提取和特征筛选,确定入模变量;/n将所述用户数据训练样本和所述入模变量输入待训练模型进行处理,获得所述用户数据训练样本的输出结果;/n根据所述用户数据训练样本的样本标签、所述输出结果及预设的目标函数对所述待训练模型的模型参数进行调整;/n其中,所述待训练模型的损失函数包括表征所有正样本的损失函数值的第一函数项和表征所有负样本的损失函数值的第二函数项,所述第一函数项包括表示正样本被预测为负样本时的第一惩罚系数,所述第二函数项包括表示负样本被预测为正样本时的第二惩罚系数,所述第一惩罚系数大于所述第二惩罚系数。/n

【技术特征摘要】
1.一种拒客回捞模型训练方法,其特征在于,所述方法包括:
获取包括多个用户数据训练样本,所述用户数据训练样本包括正样本及负样本,所述正样本的样本标签表征不需要回捞的用户,所述负样本的样本标签表征需要回捞的用户;
对所述用户数据训练样本进行特征提取和特征筛选,确定入模变量;
将所述用户数据训练样本和所述入模变量输入待训练模型进行处理,获得所述用户数据训练样本的输出结果;
根据所述用户数据训练样本的样本标签、所述输出结果及预设的目标函数对所述待训练模型的模型参数进行调整;
其中,所述待训练模型的损失函数包括表征所有正样本的损失函数值的第一函数项和表征所有负样本的损失函数值的第二函数项,所述第一函数项包括表示正样本被预测为负样本时的第一惩罚系数,所述第二函数项包括表示负样本被预测为正样本时的第二惩罚系数,所述第一惩罚系数大于所述第二惩罚系数。


2.根据权利要求1所述的方法,其特征在于,所述目标函数的公式如下:



其中,yi表示用户数据训练样本i的真实标签,表示用户数据训练样本i的预测标签为正样本的概率;
数据项为所述第一函数项,w0表示所述第一惩罚系数;表示不同正样本计算损失函数值的调制系数,r表示权重调整比例,r≥0;
数据项为所述第二函数项,w1表示所述第二惩罚系数;表示不同负样本计算损失函数值的调制系数,r表示权重调整比例,r≥0。


3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据用户数据训练样本中正负样本比例进行设置所述第一惩罚系数、第二惩罚系数及权重调整比例;或
使用所述用户数据训练样本进行网格搜索以确定所述第一惩罚系数、第二惩罚系数及权重调整比例。


4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
使用所述用户数据训练样本和所述入模变量,对待训练模型进行多次训练获得不同的已训练模型;其中,每次训练使用的不同的系数进行网格搜索;
通过预设的评价函数计算各所述已训练模型的评价指标值;
将所述评价指标值最高的已训练模型作为训练完成的拒客回捞模型。


5.根据权利要求4所述的方法,其特征在于,所述评价函数的评价指标包括曲线下面积AUC指标或Kolmogorov-Smirnov指标。


6.根据权利要求4所述的方法,...

【专利技术属性】
技术研发人员:顾凌云谢旻旗段湾乔韵如王震宇
申请(专利权)人:上海冰鉴信息科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1