信贷风险等级的确定方法、装置、存储介质及电子设备制造方法及图纸

技术编号:39408040 阅读:17 留言:0更新日期:2023-11-19 16:00
本申请公开了一种信贷风险等级的确定方法、装置、存储介质及电子设备。涉及金融科技技术领域,其中,该方法包括:获取目标对象对应的信贷数据;将信贷数据输入至目标模型中,得到目标模型输出的目标对象对应的信贷风险等级,其中,信贷风险等级用于表征目标对象存在信贷风险的程度,目标模型为将历史信贷数据作为训练样本训练得到的随机森林模型,目标模型由目标决策树集合中的目标决策树组成,目标决策树集合是依据L棵目标决策树之间的平均关联度得到的决策树集合,平均关联度用于表征L棵目标决策树之间的关联程度,L为正整数。本申请解决了相关技术在对客户进行信贷风险等级评估时,存在评估准确率较低的技术问题。存在评估准确率较低的技术问题。存在评估准确率较低的技术问题。

【技术实现步骤摘要】
信贷风险等级的确定方法、装置、存储介质及电子设备


[0001]本申请涉及金融科技
,具体而言,涉及一种信贷风险等级的确定方法、装置、存储介质及电子设备。

技术介绍

[0002]在金融行业,在用户向金融机构申请贷款时,银行等金融机构通常会对用户的征信信息、经济状况等信贷数据进行审核来确定是否通过用户的贷款申请请求。
[0003]现有技术通常通过随机森林算法来评估用户的风险状况,以确定是否通过用户的贷款申请请求。其中,随机森林算法是一种基于决策树的集成分类算法,其克服了决策树过拟合问题,对不平衡样本、噪声和异常值有较好的容忍性,预测准确率较高,被广泛应用在金融决策、负载预测、生物信息、图像分类、信息检索和市场销售等领域。但是,由于随机森林算法的性能取决于每个决策树的分类精准度和决策树之间的多样性,为了提高信贷数据的评估性能,现有技术通过装袋法(Bagging)学习分类器来提高个体分类精度,但是该方法容易造成分类器集群的多样性较低,从而导致信贷风险评估的准确率较低。为了增加分类器集群的多样性,现有技术通过在随机森林构建算法中引入随机子空间方法来增加决策树之间的多样性,但是该方法容易造成单个分类器的准确性较低的问题,从而导致信贷风险评估的准确率较低。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本申请提供了一种信贷风险等级的确定方法、装置、存储介质及电子设备,以至少解决相关技术在对客户进行信贷风险等级评估时,存在评估准确率较低的技术问题。
[0006]根据本申请的一个方面,提供了一种信贷风险等级的确定方法,包括:获取目标对象对应的信贷数据;将所述信贷数据输入至目标模型中,得到所述目标模型输出的目标对象对应的信贷风险等级,其中,所述信贷风险等级用于表征所述目标对象存在信贷风险的程度,所述目标模型为将历史信贷数据作为训练样本训练得到的随机森林模型,所述目标模型由目标决策树集合中的目标决策树组成,所述目标决策树集合是依据L棵目标决策树之间的平均关联度得到的决策树集合,所述平均关联度用于表征所述L棵目标决策树之间的关联程度,L为正整数。
[0007]进一步地,所述目标模型通过如下过程得到:获取样本数据集合,其中,所述样本数据集合中包括M个对象中的每个对象在历史时间段内的历史信贷数据以及所述每个对象在所述历史时间段内的信贷风险等级,M为正整数;将所述样本数据集合划分为训练数据集和测试数据集;基于所述训练数据集中的数据对初始随机森林模型进行模型训练,得到目标随机森林模型,其中,所述初始随机森林模型由N棵决策树组成,N为正整数;将所述测试数据集中的数据输入至所述目标随机森林模型中,得到所述目标随机森林模型输出的N棵决策树中的每棵决策树所对应的分类结果,其中,所述每棵决策树所对应的分类结果用于
表征该棵决策树对所述测试数据集中的每个对象的信贷风险等级的预测结果;基于所述每棵决策树所对应的分类结果对所述N棵决策树进行筛选,得到所述目标决策树集合;基于所述目标决策树集合构建所述目标模型。
[0008]进一步地,在基于所述训练数据集中的数据对初始随机森林模型进行模型训练,得到目标随机森林模型之前,所述方法还包括:基于所述训练数据集中的历史信贷数据生成所述N棵决策树;基于所述N棵决策树构建所述初始随机森林模型。
[0009]进一步地,基于所述每棵决策树所对应的分类结果对所述N棵决策树进行筛选,得到所述目标决策树集合,包括:基于所述每棵决策树所对应的分类结果确定所述每棵决策树的AUC值,其中,所述每棵决策树的AUC值用于表征该棵决策树对所述历史信贷数据进行分类的分类精确度;基于所述每棵决策树的AUC值对所述N棵决策树进行所述筛选,得到所述L棵目标决策树,其中,每棵目标决策树的AUC值高于其他决策树的AUC值,所述其他决策树为所述N棵决策树中除所述L棵目标决策树之外的决策树,L小于N;获取所述L棵目标决策树之间的平均关联度;基于所述L棵目标决策树之间的平均关联度确定所述目标决策树集合。
[0010]进一步地,基于所述每棵决策树的AUC值对所述N棵决策树进行所述筛选,得到L棵目标决策树,包括:依据所述每棵决策树的AUC值对所述N棵决策树进行从大到小的排序,得到排序结果;依据所述排序结果确定排名前L的决策树为所述L棵目标决策树。
[0011]进一步地,基于所述L棵目标决策树之间的平均关联度确定所述目标决策树集合,包括:基于所述L棵目标决策树随机生成K个决策树集合,其中,每个决策树集合中包括至少一个目标决策树,K为正整数;基于预设适应度函数以及所述L棵目标决策树之间的平均关联度计算每个决策树集合的适应度值,其中,所述适应度值用于表征所述决策树集合中的决策树之间的关联程度,所述适应度值与所述决策树之间的关联程度呈负相关;基于所述每个决策树集合的适应度值从所述K个决策树集合中确定所述目标决策树集合,其中,所述目标决策树集合为所述K个决策树集合中的适应度值最大的决策树集合。
[0012]进一步地,在将所述信贷数据输入至目标模型中,得到所述目标模型输出的目标对象对应的信贷风险等级之后,所述方法还包括:检测所述目标对象对应的信贷风险等级是否大于预设等级;在所述信贷风险等级大于所述预设等级的情况下,禁止通过所述目标对象对应的贷款申请请求;在所述信贷风险等级小于或等于所述预设等级的情况下,通过所述目标对象对应的贷款申请请求。
[0013]根据本申请的另一方面,还提供了一种信贷风险等级的确定装置,包括:获取模块,用于获取目标对象对应的信贷数据;确定模块,用于将所述信贷数据输入至目标模型中,得到所述目标模型输出的目标对象对应的信贷风险等级,其中,所述信贷风险等级用于表征所述目标对象存在信贷风险的程度,所述目标模型为将历史信贷数据作为训练样本训练得到的随机森林模型,所述目标模型由目标决策树集合中的目标决策树组成,所述目标决策树集合是依据L棵目标决策树之间的平均关联度得到的决策树集合,所述平均关联度用于表征所述L棵目标决策树之间的关联程度,L为正整数。
[0014]根据本申请的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述的信贷风险等级的确定方法。
[0015]根据本申请的另一方面,还提供了一种电子设备,电子设备包括一个或多个处理器;存储器,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现用于运行程序,其中,程序被设置为运行时执行上述的信贷风险等级的确定方法。
[0016]在本申请中,首先获取目标对象对应的信贷数据;然后将所述信贷数据输入至目标模型中,得到所述目标模型输出的目标对象对应的信贷风险等级,其中,所述信贷风险等级用于表征所述目标对象存在信贷风险的程度,所述目标模型为将历史信贷数据作为训练样本训练得到的随机森林模型,所述目标模型由目标决策树集合中的目标决策树组成,所述目标决策树集合是依据L棵目标决策树之间的平均关联度得到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信贷风险等级的确定方法,其特征在于,包括:获取目标对象对应的信贷数据;将所述信贷数据输入至目标模型中,得到所述目标模型输出的目标对象对应的信贷风险等级,其中,所述信贷风险等级用于表征所述目标对象存在信贷风险的程度,所述目标模型为将历史信贷数据作为训练样本训练得到的随机森林模型,所述目标模型由目标决策树集合中的目标决策树组成,所述目标决策树集合是依据L棵目标决策树之间的平均关联度得到的决策树集合,所述平均关联度用于表征所述L棵目标决策树之间的关联程度,L为正整数。2.根据权利要求1所述的方法,其特征在于,所述目标模型通过如下过程得到:获取样本数据集合,其中,所述样本数据集合中包括M个对象中的每个对象在历史时间段内的历史信贷数据以及所述每个对象在所述历史时间段内的信贷风险等级,M为正整数;将所述样本数据集合划分为训练数据集和测试数据集;基于所述训练数据集中的数据对初始随机森林模型进行模型训练,得到目标随机森林模型,其中,所述初始随机森林模型由N棵决策树组成,N为正整数;将所述测试数据集中的数据输入至所述目标随机森林模型中,得到所述目标随机森林模型输出的N棵决策树中的每棵决策树所对应的分类结果,其中,所述每棵决策树所对应的分类结果用于表征该棵决策树对所述测试数据集中的每个对象的信贷风险等级的预测结果;基于所述每棵决策树所对应的分类结果对所述N棵决策树进行筛选,得到所述目标决策树集合;基于所述目标决策树集合构建所述目标模型。3.根据权利要求2所述的方法,其特征在于,在基于所述训练数据集中的数据对初始随机森林模型进行模型训练,得到目标随机森林模型之前,所述方法还包括:基于所述训练数据集中的历史信贷数据生成所述N棵决策树;基于所述N棵决策树构建所述初始随机森林模型。4.根据权利要求2所述的方法,其特征在于,基于所述每棵决策树所对应的分类结果对所述N棵决策树进行筛选,得到所述目标决策树集合,包括:基于所述每棵决策树所对应的分类结果确定所述每棵决策树的AUC值,其中,所述每棵决策树的AUC值用于表征该棵决策树对所述历史信贷数据进行分类的分类精确度;基于所述每棵决策树的AUC值对所述N棵决策树进行所述筛选,得到所述L棵目标决策树,其中,每棵目标决策树的AUC值高于其他决策树的AUC值,所述其他决策树为所述N棵决策树中除所述L棵目标决策树之外的决策树,L小于N;获取所述L棵目标决策树之间的平均关联度;基于所述L棵目标决策树之间的平均关联度确定所述目标决策树集合。5.根据权利要求4所述的...

【专利技术属性】
技术研发人员:吕彩艳路钰莹廖勤胡涛
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1