System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及信贷领域,特别涉及一种授信额度确定方法、装置、设备及存储介质。
技术介绍
1、对于小微企业信贷业务,传统的授信流程通常需要客户经理线下调研之后给出客户的授信额度。随着互联网技术的进步以及征信数据、金融数据和政务数据的积累和打通,在信贷场景中,一些金融机构已经采用大数据建模技术实现互联网线上自动授信。多元线性回归是一种常见的用于建立授信额度模型的数学算法,通过历史授信数据作模型拟合,旨在建立一个稳定的、准确度较高的授信额度模型。通常的做法是以历史授信客户作为模型样本,客户的历史授信额度作为目标变量(即通常所说的y变量),以客户的征信数据、交易流水数据、税收财务数据、资产负债数据等数据为基础进行特征衍生(即用于预测额度的x变量),通过特征筛选和模型训练得到多元线性回归模型,确定最终入模特征和每个特征的系数,将每个入模特征和该特征对应的回归系数相乘并进行加总得到模型所预测的授信额度。
2、目前业内大多数基于多元线性回归算法开发的授信额度模型都是以未经转换的特征(x变量)进行授信额度模型的训练和开发,此方法可能存在以下问题:首先是原始特征可能存在异常值和缺失值,多元线性回归模型易受异常值的影响从而导致模型过拟合问题,同时特征缺失值的处理也较为繁琐;其次是特征和授信额度之间的线性相关关系不是严格单调的,导致变量的业务含义不清晰;再次,许多原始特征和授信额度的线性相关性不强,使得建模时有效特征过少从而导致额度模型拟合度不高。因此,如何在应用多元线性回归算法建立授信额度模型时能够提高特征和授信额度的线性相关性和特征的
技术实现思路
1、有鉴于此,本专利技术的目的在于提供一种授信额度确定方法、装置、设备及存储介质,能够在应用多元线性回归算法建立授信额度模型时能够提高特征和授信额度的线性相关性和特征的业务可解释性,降低模型的过拟合风险,同时还可以更为方便高效地处理特征异常值和缺失值。其具体方案如下:
2、第一方面,本申请公开了一种授信额度确定方法,包括:
3、基于若干历史用户的目标数据确定衍生后特征,对所述衍生后特征进行初步筛选,获取初步筛选后特征;所述目标数据包括征信数据、交易流水数据、税收财务数据以及资产负债数据;
4、对所述衍生后特征进行等频分组,并计算相应的各特征分组的平均授信额度,基于所述平均授信额度的分布对各所述特征分组进行相应的调整,以得到目标特征分组;
5、利用各所述特征分组对应的所述平均授信额度替换各所述特征分组对应的所述衍生后特征的取值,以确定替换后特征,确定所述衍生后特征的取值缺失的样本,利用所述样本对应的所述平均授信额度填充缺失值,以确定填充后特征;
6、基于所述替换后特征以及所述填充后特征确定转换后特征,利用所述初步筛选后特征、所述转换后特征以及预先确定的数据集通过多元线性回归模型训练预设的授信额度模型,以得到目标授信额度模型;
7、基于所述目标授信额度模型以及目标用户对应的所述目标数据确定所述目标用户的目标授信额度。
8、可选的,所述基于若干历史用户的目标数据确定衍生后特征,包括:
9、根据对若干所述历史用户的所述目标数据执行时间切片的操作确定所述衍生后特征;
10、或,根据对若干所述历史用户的所述目标数据执行计算统计量的操作确定所述衍生后特征。
11、可选的,所述对所述衍生后特征进行等频分组,包括:
12、将所述衍生后特征进行升序排序,将相应的排序后特征进行等频分组。
13、可选的,所述基于所述平均授信额度的分布对各所述特征分组进行相应的调整,以得到目标特征分组,包括:
14、判断各所述平均授信额度与相应的各所述特征分组之间的趋势是否单调且是否符合预设的业务要求;
15、若均不满足,则对所述特征分组的切分点进行相应的调整,或执行合并相邻所述特征分组的操作。
16、可选的,所述利用各所述特征分组对应的所述平均授信额度替换各所述特征分组对应的所述衍生后特征的取值,以确定替换后特征之后,还包括:
17、对所述替换后特征对应的值进行取整操作,以得到相应的调整后特征;
18、判断所述调整后特征是否符合预设的所述业务要求;
19、若不符合,则将相应的所述调整后特征进行删除。
20、可选的,所述利用所述初步筛选后特征、所述转换后特征以及预先确定的数据集通过多元线性回归模型训练预设的授信额度模型,以得到目标授信额度模型,包括:
21、通过多元线性回归算法利用预先确定的训练集以及验证集创建初始授信额度模型,并得到相应的所述初始授信额度模型检验结果、显著性水平以及目标回归系数;
22、基于所述初步筛选后特征、所述转换后特征、所述初始授信额度模型检验结果、显著性水平以及目标回归系数确定所述目标授信额度模型。
23、可选的,所述基于所述目标授信额度模型以及目标用户对应的所述目标数据确定所述目标用户的目标授信额度之后,还包括:
24、基于预先确定的跨时间测试集对所述目标授信额度模型的预测能力进行评估;
25、若相应的评估结果符合预设要求,则将所述目标授信额度确定为最终的授信额度;
26、若相应的所述评估结果不符合预设要求,则对所述目标授信额度模型进行重新训练。
27、第二方面,本申请公开了一种授信额度确定装置,包括:
28、初步筛选后特征获取模块,用于基于若干历史用户的目标数据确定衍生后特征,对所述衍生后特征进行初步筛选,获取初步筛选后特征;所述目标数据包括征信数据、交易流水数据、税收财务数据以及资产负债数据;
29、目标特征分组获取模块,用于对所述衍生后特征进行等频分组,并计算相应的各特征分组的平均授信额度,基于所述平均授信额度的分布对各所述特征分组进行相应的调整,以得到目标特征分组;
30、填充后特征获取模块,用于利用各所述特征分组对应的所述平均授信额度替换各所述特征分组对应的所述衍生后特征的取值,以确定替换后特征,确定所述衍生后特征的取值缺失的样本,利用所述样本对应的所述平均授信额度填充缺失值,以确定填充后特征;
31、目标授信额度模型获取模块,用于基于所述替换后特征以及所述填充后特征确定转换后特征,利用所述初步筛选后特征、所述转换后特征以及预先确定的数据集通过多元线性回归模型训练预设的授信额度模型,以得到目标授信额度模型;
32、授信额度确定模块,用于基于所述目标授信额度模型以及目标用户对应的所述目标数据确定所述目标用户的目标授信额度。
33、第三方面,本申请公开了一种电子设备,包括:
34、存储器,用于保存计算机程序;
35、处理器,用于执行所述计算机程序以实现前述的授信额度确定方法。
本文档来自技高网...【技术保护点】
1.一种授信额度确定方法,其特征在于,包括:
2.根据权利要求1所述的授信额度确定方法,其特征在于,所述基于若干历史用户的目标数据确定衍生后特征,包括:
3.根据权利要求1所述的授信额度确定方法,其特征在于,所述对所述衍生后特征进行等频分组,包括:
4.根据权利要求1所述的授信额度确定方法,其特征在于,所述基于所述平均授信额度的分布对各所述特征分组进行相应的调整,以得到目标特征分组,包括:
5.根据权利要求1所述的授信额度确定方法,其特征在于,所述利用各所述特征分组对应的所述平均授信额度替换各所述特征分组对应的所述衍生后特征的取值,以确定替换后特征之后,还包括:
6.根据权利要求1所述的授信额度确定方法,其特征在于,所述利用所述初步筛选后特征、所述转换后特征以及预先确定的数据集通过多元线性回归模型训练预设的授信额度模型,以得到目标授信额度模型,包括:
7.根据权利要求1至6任一项所述的授信额度确定方法,其特征在于,所述基于所述目标授信额度模型以及目标用户对应的所述目标数据确定所述目标用户的目标授信额度之后,还
8.一种授信额度确定装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的授信额度确定方法的步骤。
...【技术特征摘要】
1.一种授信额度确定方法,其特征在于,包括:
2.根据权利要求1所述的授信额度确定方法,其特征在于,所述基于若干历史用户的目标数据确定衍生后特征,包括:
3.根据权利要求1所述的授信额度确定方法,其特征在于,所述对所述衍生后特征进行等频分组,包括:
4.根据权利要求1所述的授信额度确定方法,其特征在于,所述基于所述平均授信额度的分布对各所述特征分组进行相应的调整,以得到目标特征分组,包括:
5.根据权利要求1所述的授信额度确定方法,其特征在于,所述利用各所述特征分组对应的所述平均授信额度替换各所述特征分组对应的所述衍生后特征的取值,以确定替换后特征之后,还包括:
6.根据...
【专利技术属性】
技术研发人员:李明宇,王雷,于辉,吴雅倩,马顺华,
申请(专利权)人:浙江邦盛科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。