【技术实现步骤摘要】
一种基于信用变量的信用标签确定方法及相关产品
[0001]本申请涉及数据分析
,特别是涉及一种基于信用变量的信用标签确定方法及相关产品。
技术介绍
[0002]随着我国日益活跃的市场经营活动,为了促进经济的进一步发展以满足市场为扩大生产力的资金需求、以偿还和付息为条件的金融贷款业务在数量上呈现出爆炸式增长,从而金融机构面在面对数量急剧增长的申请贷款业务的客户时,要如何进行信用风险控制已经成为金融机构亟待解决的问题。
[0003]对于信用风险控制领域而言,利用机器学习针对不同的贷款业务建立对应信用风险评估模型,并使用信用风险评估模型为申请贷款的客户进行信用评分再判断是否要发放贷款给客户,是当下金融机构常用的信用风险控制手段。在机器学习建立模型的过程中,通常需要使用大量带有信用标签的客户样本,然而,只有成功地在金融机构申请并支用贷款、具有了完整的贷款表现的客户才会被打上信用标签。由于在现实中,通常是没有完整的贷款表现的客户占据着更大的数量,从而在实际建模过程中,往往会出现不带有信用标签的客户样本数量过多的情况,这使 ...
【技术保护点】
【技术特征摘要】
1.一种基于信用变量的信用标签确定方法,其特征在于,所述方法包括:获取T个客户样本,所述T个客户样本中每个客户样本包括至少一个目标信用变量,所述信用变量用于表征对应客户样本的单维度信用水平,且所述T个客户样本中的M个第一客户样本包括信用标签、N个第二客户样本不包括所述信用标签,所述信用标签用于表征对应客户样本的总体信用水平;根据所述M个第一客户样本与所述N个第二客户样本的信用变量,确定所述N个第二客户样本中每个第二客户样本的信用标签。2.根据权利要求1所述的方法,其特征在于,所述至少一个目标信用变量的确定方法如下:获取所述M个第一客户样本中包括的多个参考信用变量;基于所述多个参考信用变量中每个参考信用变量对所述M个第一客户样本进行分箱,得到多个分箱结果;获取所述多个分箱结果中每个分箱结果对应的证据权重WOE值,所述WOE值用于表征对应分箱结果中的第一标签客户样本对应的数量和第二标签客户样本对应的数量之间的比值的对数;确定与对应分箱结果的WOE值之间满足单调性条件的至少一个参考信用变量为所述至少一个目标信用变量。3.根据权利要求2所述的方法,其特征在于,在所述确定与对应分箱结果的WOE值之间满足单调性条件的至少一个参考信用变量之后,所述方法还包括:获取所述每个分箱结果对应的信息价值IV值,所述IV值用于表征对应参考信用变量对客户样本的信用标签的预测准确度;根据所述每个分箱结果对应的WOE值,确定所述至少一个参考信用变量中的第一参考信用变量与除所述第一参考信用变量之外的其他参考信用变量之间的相关性;将与所述第一参考信用变量之间的相关性大于或等于预设相关性、且对应IV值小于或等于预设数值的其他参考信用变量进行剔除,将剩余的其他参考信用变量确定为所述第一参考信用变量,重复所述将与所述第一参考信用变量之间的相关性大于或等于预设相关性、且对应IV值小于预设数值的其他参考信用变量进行剔除的过程,直到确定出参考信用变量群组,所述参考信用变量群组中包括的参考信用变量之间的IV值都大于所述预设数值;确定所述参考信用变量群组中包括的参考信用变量为所述至少一个目标信用变量。4.根据权利要求3所述的方法,其特征在于,所述根据所述M个第一客户样本与所述N个第二客户样本的信用变量,确定所述N个第二客户样本中每个第二客户样本的信用标签,包括:确定所述M个第一客户样本中每个第一客户样本包括的至少一个目标信用变量中每个目标信用变量对应的IV值;根据所述每个第一客户样本包括的所述每个目标信用变量对应的数值大小、IV值以及所述每个第二客户样本包括的所述每个目标信用变量对应的数值大小,构建T*T欧氏距离矩阵;根据所述T*T欧氏距离矩阵,确定所述N个第二客户样本中每个第二客户样本的信用标
签。5.根据权利要求1
‑
4任一项所述的方法,其特征在于,所述M个第一客户样本中包括M1个信用标签为第一标签的客户样本和M2个信用标签为第二标签的客户样本,所述第一标签对应客户样本的总体信用水平高于所述第二标签对应客户样本,在所述根据所述M个第一客户样本与所述N个第二客户样本的信用变量,确定所述N个第二客户样本中每个第二客户样本的信用标签之前,所述方法还包括:确定所述第一标签客户样本对应的数量M1和所述第二标签客户样本对应的数量M2之间的比值是否大于预设比值;若所述第一标签客户样本对应的数量M1和所述第二标签客户样本对应的数量M2之间的比值大于所述预设比值,则对所述第二标签客户样本进行过采样处理,得到过采样后的M3个第二标签客户样本...
【专利技术属性】
技术研发人员:薛永营,黄艇,赵彦晖,耿心伟,曾源,
申请(专利权)人:深圳微众信用科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。