用户失联等级获取方法、装置及存储介质制造方法及图纸

技术编号:32834790 阅读:12 留言:0更新日期:2022-03-26 20:53
本申请公开了一种用户失联等级获取方法、装置及存储介质,涉及数据处理技术领域。具体实现方案为:获取用户变量数据,对所述变量数据进行预处理及衍生,以获取第一待定变量;对所述第一待定变量进行分箱处理,根据业务逻辑对所述第一待定变量进行筛选,以获取第二待定变量;对所述第二待定变量进行证据权重映射,并根据相关性和信息值对所述第二待定变量进行筛选,以获取入模变量;将所述用户的入模变量输入评分模型,以获取所述用户的失联等级。本申请实施例可以筛选得到对预测失联等级关系更紧密的变量,避免工作人员无效的作业,更精准地获取用户的失联等级。精准地获取用户的失联等级。精准地获取用户的失联等级。

【技术实现步骤摘要】
用户失联等级获取方法、装置及存储介质


[0001]本公开涉及大数据数据处理
,尤其涉及一种用户失联等级获取方法、装置及存储介质。

技术介绍

[0002]随着金融科技不断发展,大数据、人工智能技术日趋成熟,商业银行的催收业务也在向智能化、精细化、产业化方向转型。近些年受内外部因素影响,零售信贷催收压力加大、失联率明显提高。在传统的催收方式中,不少逾期贷款留存的客户手机号码无法接通或者在网状态异常,无法实现催收触达,同时催收作业人员需一一拨打电话方能确认客户失联、费时费力。例如在电话催收场景中,一般电催员平均可以在拨打3次电话内得到客户回应。而对于失联客户,往往拨打6次及以上依旧无法接通。对人力物力成本造成了极大的浪费。

技术实现思路

[0003]本公开提供一种用户失联等级获取方法、装置及存储介质,以至少解决相关技术中避免工作人员无效的作业的问题。本公开的技术方案如下:
[0004]根据本公开实施例的第一方面,提供一种用户失联等级获取方法,包括:
[0005]获取用户变量数据,对所述变量数据进行预处理及衍生,以获取第一待定变量;
[0006]对所述第一待定变量进行分箱处理,根据业务逻辑对所述第一待定变量进行筛选,以获取第二待定变量;
[0007]对所述第二待定变量进行证据权重映射,并根据相关性和信息值对所述第二待定变量进行筛选,以获取入模变量;
[0008]将所述用户的入模变量输入评分模型,以获取所述用户的失联等级。
[0009]可选的,所述对所述变量数据进行预处理及衍生,以获取第一待定变量,包括以下的至少一项:
[0010]删除缺失率大于或等于缺失率阈值的变量,将剩余变量确定为第一待定变量;
[0011]删除最大单一值占比大于或等于单一值比例阈值的变量,将剩余变量确定为第一待定变量。
[0012]可选的,所述对所述第一待定变量进行分箱处理,根据业务逻辑对所述第一待定变量进行筛选,以获取第二待定变量,包括:
[0013]对所述第一待定变量对应样本进行分箱处理,并获取所述第一待定变量的群体稳定性指数和信息值;
[0014]根据所述群体稳定性指数和信息值筛选所述第一待定变量,以获取所述第二待定变量。
[0015]可选的,所述分箱处理后,每个箱中坏样本数量大于坏样本数量阈值,每个箱中样本数量占总样本数量的比值大于比例阈值。
[0016]可选的,所述根据所述群体稳定性指数和信息值筛选所述第一待定变量,以获取
所述第二待定变量,包括:
[0017]删除群体稳定性指数小于群体稳定性阈值的第一待定变量,并删除信息值小于信息值阈值的第一待定变量,将其余第一待定变量确定为第二待定变量。
[0018]可选的,所述对所述第二待定变量进行证据权重映射,并根据相关性和信息值对所述第二待定变量进行筛选,以获取入模变量,包括:
[0019]获取所述第二待定变量中变量对的相关性指数,并计算所述第二待定变量的方差膨胀系数和违约概率;
[0020]获取相关性指数大于相关性阈值的第二变量对,并保留信息值最大的第二待定变量;
[0021]删除方差膨胀系数大于膨胀系数阈值的所述第二待定变量,删除违约概率大于概率阈值的第二待定变量,以获取所述入模变量。
[0022]根据本公开实施例的第二方面,提供一种评分模型训练方法,用于训练如第一方法所述的评分模型,其特征在于,包括:
[0023]建立训练数据集,所述训练数据集包括用户的入模变量;
[0024]对所述用户的失联等级进行标注;
[0025]将所述训练数据集输入所述评分模型进行训练,以获取推荐评分模型。
[0026]根据本公开实施例的第三方面,提供一种用户失联等级获取装置,包括:
[0027]预处理模块,用于获取用户变量数据,对所述变量数据进行预处理及衍生,以获取第一待定变量;
[0028]分箱筛选模块,用于对所述第一待定变量进行分箱处理,根据业务逻辑对所述第一待定变量进行筛选,以获取第二待定变量;
[0029]映射筛选模块,用于对所述第二待定变量进行证据权重映射,并根据相关性和信息值对所述第二待定变量进行筛选,以获取入模变量;
[0030]评分模块,用于将所述用户的入模变量输入评分模型,以获取所述用户的失联等级。
[0031]可选的,所述预处理模块,包括:
[0032]第一预处理子模块,删除缺失率大于或等于缺失率阈值的变量,将剩余变量确定为第一待定变量;
[0033]第二预处理子模块,用于删除最大单一值占比大于或等于单一值比例阈值的变量,将剩余变量确定为第一待定变量。
[0034]可选的,所述分箱筛选模块,包括:
[0035]分箱子模块,用于对所述第一待定变量对应样本进行分箱处理,并获取所述第一待定变量的群体稳定性指数和信息值;
[0036]第一筛选子模块,用于根据所述群体稳定性指数和信息值筛选所述第一待定变量,以获取所述第二待定变量。
[0037]可选的,所述分箱处理后,每个箱中坏样本数量大于坏样本数量阈值,每个箱中样本数量占总样本数量的比值大于比例阈值。
[0038]可选的,所述筛选子模块,包括:
[0039]筛选单元,用于删除群体稳定性指数小于群体稳定性阈值的第一待定变量,并删
除信息值小于信息值阈值的第一待定变量,将其余第一待定变量确定为第二待定变量。
[0040]可选的,所述映射筛选模块,包括:
[0041]第二筛选子模块,用于获取所述第二待定变量中变量对的相关性指数,并计算所述第二待定变量的方差膨胀系数和违约概率;
[0042]第三筛选子模块,用于获取相关性指数大于相关性阈值的第二变量对,并保留信息值最大的第二待定变量;
[0043]第四筛选子模块,用于删除方差膨胀系数大于膨胀系数阈值的所述第二待定变量,删除违约概率大于概率阈值的第二待定变量,以获取所述入模变量。
[0044]根据本公开实施例的第四方面,提供一种评分训练装置,用于训练如第三方面所述的评分模型,包括:
[0045]数据集建立模块,用于建立训练数据集,所述训练数据集包括用户的入模变量;
[0046]标注模块,用于对所述用户的失联等级进行标注;
[0047]训练模块,用于将所述训练数据集输入所述评分模型进行训练,以获取推荐评分模型。
[0048]根据本公开实施例的第五方面,提供一种用户失联等级获取装置,其特征在于,包括:
[0049]处理器;
[0050]用于存储所述处理器可执行指令的存储器;
[0051]其中,所述处理器被配置为执行所述指令,以实现如上述第一方面中任一项所述的用户失联等级获取方法。
[0052]根据本公开实施例的第六方面,提供一种评分模型训练装置,其特征在于,包括:
[0053]处理器;
[0054]用于存储所述处理器本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户失联等级获取方法,其特征在于,包括:获取用户变量数据,对所述变量数据进行预处理及衍生,以获取第一待定变量;对所述第一待定变量进行分箱处理,根据业务逻辑对所述第一待定变量进行筛选,以获取第二待定变量;对所述第二待定变量进行证据权重映射,并根据相关性和信息值对所述第二待定变量进行筛选,以获取入模变量;将所述用户的入模变量输入评分模型,以获取所述用户的失联等级。2.根据权利要求1所述的方法,其特征在于,所述对所述变量数据进行预处理及衍生,以获取第一待定变量,包括以下的至少一项:删除缺失率大于或等于缺失率阈值的变量,将剩余变量确定为第一待定变量;删除最大单一值占比大于或等于单一值比例阈值的变量,将剩余变量确定为第一待定变量。3.根据权利要求1所述的方法,其特征在于,所述对所述第一待定变量进行分箱处理,根据业务逻辑对所述第一待定变量进行筛选,以获取第二待定变量,包括:对所述第一待定变量对应样本进行分箱处理,并获取所述第一待定变量的群体稳定性指数和信息值;根据所述群体稳定性指数和信息值筛选所述第一待定变量,以获取所述第二待定变量。4.根据权利要求3所述的方法,其特征在于,所述分箱处理后,每个箱中坏样本数量大于坏样本数量阈值,每个箱中样本数量占总样本数量的比值大于比例阈值。5.根据权利要求3所述的方法,其特征在于,所述根据所述群体稳定性指数和信息值筛选所述第一待定变量,以获取所述第二待定变量,包括:删除群体稳定性指数小于群体稳定性阈值的第一待定变量,并删除信息值小于信息值阈值的第一待定变量,将其余第一待定变量确定为第二待定变量。6.根据权利要求1所述的方法,其特征在于,所述对所述第二待定变量进行证据权重映射,并根据相关性和信息值对所述第二待定变量进行筛选,以获取入模变量,包括:获取所述第二待定变量中变量对的相关性指数,并计算所述第二待定变量的方差膨胀系数和违约概率;获取相关性指数大于相关性阈值的第二变量对,并保留信息值最大的第二待定变量;删除方差膨胀系数大于膨胀系数阈值的所述第二待定变量,删除违约概率大于概率阈值的第二待定变量,以获取所述入模变量。7.一种评分模型训练方法,用于训练如权利要求1~6所述的评分模型,其特征在于,包括:建立训练数据集,所述训练数据集包括用户的入模变量;对所述用户的失联等级进行标注;将所述训练数据集输入所述评分模型进行训练,以获取推荐评分模型。8.一种用户失联等级获取装置,其特征在于,包括:预处理模块,用于获取用户变量数据,对所述变量数据进行预处理及衍生,以获取第一待定变量;
分箱筛选模块,用于对所述第一待定变量进行分箱处理,根据业务逻辑对所述第一待定变量进行筛选,以获取第二待定变量;映射筛选模块,用于对所述第二待定变量进行证据权重映射,并根据相关性和信息值对所述第二待定变量进行筛选,以获取入模变量;评分模块,用...

【专利技术属性】
技术研发人员:张闯吕飞鹏
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1