System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及数据处理领域,尤其涉及一种信用风险识别方法、装置、设备、介质及程序产品。
技术介绍
1、随着信贷融资业务日益频繁,对客户风险控制要求越来越高,对客户的风险识别迫切需求科学的、系统的、高效的方法。相关技术中,对客户进行信用风险识别的方法往往是通过将客户信息中的相关特征传入风险识别模型中,由风险识别模型基于传入的特征对客户进行风险识别,其中,入模特征的选择往往会对最终客户风险识别结果的准确性产生影响,如何准确选择入模特征是技术人员需要考虑的问题。
2、现有技术中,通常采用断层法和穷举法来确定入模特征,其中,断层法是指由人工根据特征重要度的差值确定入模特征,受技术人员主观经验影响,入模特征的选择不够客观,易出现由于入模特征选择不准确而导致客户信用风险识别准确度低的问题。穷举法是指将所有候选特征均作为入模特征逐个尝试,运算成本高且效率低。
技术实现思路
1、鉴于上述问题,本公开提供了信用风险识别方法、装置、设备、介质和程序产品。
2、根据本公开的第一个方面,提供了一种信用风险方法,包括:获取客户信息;对客户信息执行如下操作:对客户信息执行预处理操作,从客户信息中提取多个第一特征数据;分别计算多个第一特征数据的重要度,并基于重要度确定目标特征数量;其中,目标特征用于预测客户的风险等级;基于目标特征数量从多个第一特征数据中筛选出目标特征;将目标特征传入风险识别模型,使风险识别模型基于目标特征对当前客户进行信用风险识别,得到客户的风险等级。
3、根据
4、根据本公开的实施例,计算多个待筛选特征数据的特征指标,根据特征指标对多个待筛选特征数据进行筛选,得到第一特征数据,包括:计算每一待筛选特征数据的信息价值以及各待筛选特征数据间的相关系数;根据信息价值和相关系数从多个待筛选特征数据中筛选出多个第一待筛选特征数据;计算每一第一待筛选特征数据的群体稳定性指标值、缺失率、特征数以及auc值;根据群体稳定性指标值、缺失率、特征值数以及auc值从多个第一待筛选特征数据中筛选出多个第一特征数据。
5、根据本公开的实施例,计算每一待筛选特征数据的信息价值以及各待筛选特征数据间的相关系数,包括:从多个待筛选特征数据中筛选出信息价值大于阈值对应的待筛选特征数据;计算多个筛选后的待筛选特征数据之间的相关系数。
6、根据本公开的实施例,根据信息价值和相关系数从多个待筛选特征数据中筛选出多个第一待筛选特征数据,包括:在待筛选特征数据与其他待筛选特征数据之间的相关系数小于阈值的情况下,将该待筛选特征数据确定为第一待筛选特征数据;在待筛选特征数据与其他待筛选特征数据之间的相关系数大于阈值的情况下,将多个待筛选特征数据中信息价值最大的待筛选特征数据确定为第一待筛选特征数据。
7、根据本公开的实施例,分别计算多个第一特征数据的重要度,并基于重要度确定目标特征的数量,包括:对每一第一特征数据执行如下操作:将第一特征数据传入梯度提升决策树模型中,通过调节梯度提升决策树模型中的超参数获得第一特征数据的多个重要度;根据第一特征数据的多个重要度,构建第一特征数据的重要度矩阵;基于多个第一特征数据的重要度矩阵,确定目标特征的数量。
8、根据本公开的实施例,基于多个第一特征数据的重要度矩阵,确定目标特征的数量,包括:基于特征重要度矩阵分别计算多个第一特征数据对应的第一方差以及所有第一特征数据对应的综合方差;根据第一方差和综合方差的大小关系确定目标特征数量。
9、根据本公开的实施例,基于特征重要度矩阵分别计算多个第一特征数据对应的第一方差以及所有第一特征数据对应的综合方差,包括:计算每一个特征重要度矩阵中第一特征数据的特征值;根据第一特征数据的多个特征值计算第一特征数据对应的第一方差;根据所有第一特征数据的特征值计算所有第一特征矩阵对应的综合方差。
10、本公开的第二方面提供了一种信用风险识别装置,包括:获取模块,用于获取客户信息;预处理模块,用于对客户信息执行预处理操作,从客户信息中提取多个第一特征数据;确定模块,用于分别计算多个第一特征数据的重要度,并基于重要度确定目标特征数量;其中,目标特征用于预测客户的风险等级;筛选模块,用于基于目标特征数量从多个第一特征数据中筛选出目标特征;以及识别模块,用于将目标特征传入风险识别模型,使风险识别模型基于目标特征对当前客户进行信用风险识别,得到客户的风险等级。
11、本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述方法。
12、本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述方法。
13、本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述方法。
14、根据本公开提供的信用风险识别方法、装置、设备、介质和程序产品,基于客户信息确定最终入模的目标特征数量和目标特征,以提高客户风险识别结果的准确性。其中,基于客户信息确定最终入模的目标特征数量和目标特征包括:从客户信息的多个待筛选特征数据中提取出第一特征数据,通过计算第一特征数据的重要度确定目标特征的数量并基于目标特征数量从第一特征数据中筛选出用于入模的目标特征。这种处理方法,可以有效保证最终入模特征的质量,避免由于现有技术中技术人员主观经验而造成入模特征选择不准确或入模特征选择方法过于复杂而导致信用风险识别准确性低、耗时长的问题,在有效提升信用风险识别效率的同时保证信用风险识别结果的准确性,实现高效精确的信用风险识别。
本文档来自技高网...【技术保护点】
1.一种信用风险识别方法,包括:
2.根据权利要求1所述的信用风险识别方法,所述对所述客户信息执行预处理操作,从所述客户信息中获取多个第一特征数据,包括:
3.根据权利要求2所述的信用风险识别方法,所述计算所述多个待筛选特征数据的特征指标,根据所述特征指标对多个待筛选特征数据进行筛选,得到第一特征数据,包括:
4.根据权利要求3所述的信用风险识别方法,所述计算每一待筛选特征数据的信息价值以及各待筛选特征数据间的相关系数,包括:
5.根据权利要求4所述的信用风险识别方法,所述根据所述信息价值和所述相关系数从所述多个待筛选特征数据中筛选出多个第一待筛选特征数据,包括:
6.根据权利要求1所述的信用风险识别方法,所述分别计算所述多个第一特征数据的重要度,并基于所述重要度确定目标特征的数量,包括:
7.根据权利要求6所述的信用风险识别方法,所述基于所述多个第一特征数据的重要度矩阵,确定目标特征的数量,包括:
8.根据权利要求7所述的信用风险识别方法,所述基于所述特征重要度矩阵分别计算多个第一特征数据对应的
9.一种信用风险识别装置,包括:
10.一种电子设备,包括:
11.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~8中任一项所述的方法。
12.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~8中任一项所述的方法。
...【技术特征摘要】
1.一种信用风险识别方法,包括:
2.根据权利要求1所述的信用风险识别方法,所述对所述客户信息执行预处理操作,从所述客户信息中获取多个第一特征数据,包括:
3.根据权利要求2所述的信用风险识别方法,所述计算所述多个待筛选特征数据的特征指标,根据所述特征指标对多个待筛选特征数据进行筛选,得到第一特征数据,包括:
4.根据权利要求3所述的信用风险识别方法,所述计算每一待筛选特征数据的信息价值以及各待筛选特征数据间的相关系数,包括:
5.根据权利要求4所述的信用风险识别方法,所述根据所述信息价值和所述相关系数从所述多个待筛选特征数据中筛选出多个第一待筛选特征数据,包括:
6.根据权利要求1所述的信用风险识别方法,所述分别计算所述多个第...
【专利技术属性】
技术研发人员:伏峰,杨晓旗,刘世尧,蔡宇笙,俞泱,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。