基于循环神经网络的信贷风险预测方法、装置和存储介质制造方法及图纸

技术编号:38766617 阅读:11 留言:0更新日期:2023-09-10 10:39
本公开提供的基于循环神经网络的信贷风险预测方法、装置和存储介质,包括:针对待测对象可获取的所有历史运行数据,将基准月T、输入月份跨度M及预测月份跨度N进行取值范围内的遍历,得到样本集,每个样本包括选定的输入月份跨度、预测月份跨度、待测对象的输入集合以及对应的风险评级;构建基于循环神经网络的信贷风险预测模型,利用样本集对该模型进行训练,以确定在任意输入月份跨度、预测月份跨度下,输入集合与风险评级之间的映射关系,并输出预测结果;利用训练完毕的信贷风险预测模型确定待测对象的信贷风险情况。本公开能够提前预测风险并科学准确标注,充分考虑输入数据的时序性,可以灵活调整输入与预测月份的跨度。可以灵活调整输入与预测月份的跨度。可以灵活调整输入与预测月份的跨度。

【技术实现步骤摘要】
基于循环神经网络的信贷风险预测方法、装置和存储介质


[0001]本公开属于数据处理
,特别涉及一种基于循环神经网络的信贷风险预测方法、装置和存储介质。

技术介绍

[0002]对待测对象信贷情况的监控在风控场景下尤为重要,依据待测对象一段时间内的运营数据,预测其未来发生风险的可能性,将有助于监控方提前甄别、对症下药、规避风险、提高收益。
[0003]现有监控方案主要有两种:一是基于专家经验评价,二是基于决策树或线性分类器。
[0004]基于专家经验评价的监控方案的问题有:
[0005]1、效率低下:大量数据报表的整理工作流程繁琐、错误率高,并且需要人工研判信贷风险,费时费力。
[0006]2、评价滞后:目前往往采用同步指标评价待测用户的信贷风险,当一些核心指标(财务数据、还款、盘点、征信等)出现异常时,则风险已经同步发生,无法实现预判的目标。
[0007]3、主观性强:依据专家经验建立的信贷风险评价体系极度依赖专家的经验,无法挖掘数据背后的潜在联系,不够客观理性。
[0008]基于决策树或线性分类器的监控方案的问题有:
[0009]1、时序性差:对于时序的待测对象运营数据,无法依据前后若干月数据的变化关联挖掘潜在的风险,无法依据数据时间的远近给予不同的重视程度。
[0010]2、灵活性差:无法灵活地变换输入与预测月份的跨度,一旦需要延长原月份跨度,需要彻底改变原有算法结构。

技术实现思路

[0011]本公开旨在至少解决现有技术中存在的技术问题之一。
[0012]为此,本公开第一方面实施例提供的基于循环神经网络的信贷风险预测方法,能够依据一段时间内的待测对象历史运营数据,预测若干个月之后该待测对象可能的信贷风险情况,并标注具体的风险等级。基于该方案实现的信贷风险预测方法,能够提前预测风险并科学准确标注,充分考虑输入数据的时序性,可以灵活调整输入与预测月份的跨度。
[0013]本公开第一方面实施例提供的一种基于循环神经网络的信贷风险预测方法,包括:
[0014]设定任意月份为基准月T,对基准月及基准月之前M

1个月和基准月之后N个月的待测对象的历史运营数据进行预处理,将预处理后的基准月及其之前M

1个月的待测对象的历史运营数据构成输入集合x,对预处理后的基准月之后N个月的待测对象的历史运营数据进行人工评估,得到预测月份跨度为N时待测对象的风险评级将基准月T、输入月份跨度M及预测月份跨度N进行取值范围内的遍历,得到样本集,每个样本包括选定的输入月份
跨度、预测月份跨度、待测对象的输入集合以及对应的风险评级,按设定比例将样本集划分为训练集和测试集;
[0015]构建基于循环神经网络的信贷风险预测模型,利用训练集对信贷风险预测模型进行训练,以确定在任意输入月份跨度M、预测月份跨度N下,输入集合x与风险评级之间的映射关系,并输出预测结果y,将训练完毕的循环神经网络在测试集上进行测试,得到训练完毕的信贷风险预测模型;
[0016]按照监控方需求任意设定输入月份跨度和预测月份跨度获取待测对象当前月及其之前个月的运营数据作为待预测数据,对其进行预处理后,得到待测对象个月的输入集合将所述输入集合输入训练完毕的信贷风险预测模型,得到距离当前月之后个月的信贷风险情况的预测结果y,从而确定待测对象的信贷风险情况。
[0017]在一些实施例中,对所述运营数据进行的预处理包括对所述运营数据依次进行集成、清洗、补全、标准化和PCA降维处理。
[0018]在一些实施例中,所述标准化处理采用Z

score标准化处理。
[0019]在一些实施例中,按照以下步骤得到预测月份跨度为N时待测对象的风险评级
[0020]将预处理后的基准月之后N个月的待测对象的历史运营数据构成评级集合x'={x
n
},n=[1,2,

,N],x
n
表示基准月之后第n个月的待测对象的历史运营数据;
[0021]对所述评级集合x'中每月的历史运营数据x
n
分别进行人工评级,按照评级结果划分月度信贷风险等级为低风险、中风险、高风险三档,具体为:
[0022]从评级集合x'中的各类指标中选定若干核心指标,并为各核心指标分别设定阶梯性阈值,针对评级集合x'中的历史运营数据x
n
,当所述历史运营数据x
n
中的核心指标超过相应的阶梯性阈值时,则分别在基准月之后第n个月的总风险值上累计相应分数;当基准月之后第n个月的总风险值属于第一区间时,记该月度信贷风险等级为低风险;当基准月之后第n个月的总风险值属于第二区间时,记该月度信贷风险等级为中风险;当基准月之后第n个月的总风险值属于第三区间时,记该月度信贷风险等级为高风险;取N个月的整体风险评级为基准月之后N个月的月度信贷风险评级中的最大值,即
[0023]在一些实施例中,将基准月T、输入月份跨度M及预测月份跨度N进行取值范围内的遍历时,T、M、N的取值需同时满足以下3个条件:
[0024]①
.数据获取窗口不超过待测对象已有的所有运营数据的起止年月,即满足:T

M+1≥M
start
,T+N≤M
end
,M
start
为待测对象已有的所有运营数据的起始年月,M
end
为待测对象已有的所有运营数据的终止年月;
[0025]②
.M∈[5,13],N∈[4,12];
[0026]③
.输入月份跨度M大于预测月份跨度N,即满足:M>N。
[0027]在一些实施例中,所述循环神经网络具有2层隐藏层,每层具有128个神经元,采用Softmax函数激活。
[0028]在一些实施例中,对所述循环神经网络进行训练时,采用平均均方差作为损失函数,通过最小化所述损失函数,更新所述循环神经网络的权值U、W、V;其中,U表示输入到隐藏层的输入权值,用于对输入循环神经网络的输入集合x进行预处理;V表示循环权值,用于
按照输入集合x中各月份的运营数据距离基准月的远近,顺次作用于隐藏层输出的每一月份的中间结果,并将该结果传递到下一循环中,直至输入集合x的所有月份循环完毕;W表示隐藏层到输出的输出权值,用于将末尾月份的最终结果处理后,得到预测结果y。
[0029]本公开第二方面实施例提供的一种基于循环神经网络的信贷风险预测装置,包括:
[0030]预处理模块,用于对待测对象当前月及其之前个月的运营数据进行预处理后,得到待测对象个月的输入集合
[0031]信贷风险预测模块,其内配置有训练完毕的信贷风险预测模型,用于根据待测对象个月的输入集合得到距离当前月之后个月的信贷风险情况的预测结果y;
[0032]所述训练完毕的信贷风险预测模型按照以下步骤得到:...

【技术保护点】

【技术特征摘要】
1.一种基于循环神经网络的信贷风险预测方法,其特征在于,包括:设定任意月份为基准月T,对基准月及基准月之前M

1个月和基准月之后N个月的待测对象的历史运营数据进行预处理,将预处理后的基准月及其之前M

1个月的待测对象的历史运营数据构成输入集合x,对预处理后的基准月之后N个月的待测对象的历史运营数据进行人工评估,得到预测月份跨度为N时待测对象的风险评级将基准月T、输入月份跨度M及预测月份跨度N进行取值范围内的遍历,得到样本集,每个样本包括选定的输入月份跨度、预测月份跨度、待测对象的输入集合以及对应的风险评级,按设定比例将样本集划分为训练集和测试集;构建基于循环神经网络的信贷风险预测模型,利用训练集对信贷风险预测模型进行训练,以确定在任意输入月份跨度M、预测月份跨度N下,输入集合x与风险评级之间的映射关系,并输出预测结果y,将训练完毕的循环神经网络在测试集上进行测试,得到训练完毕的信贷风险预测模型;按照监控方需求任意设定输入月份跨度和预测月份跨度获取待测对象当前月及其之前个月的运营数据作为待预测数据,对其进行预处理后,得到待测对象个月的输入集合将所述输入集合输入训练完毕的信贷风险预测模型,得到距离当前月之后个月的信贷风险情况的预测结果y,从而确定待测对象的信贷风险情况。2.根据权利要求1所述的信贷风险预测方法,其特征在于,对所述运营数据进行的预处理包括对所述运营数据依次进行集成、清洗、补全、标准化和PCA降维处理。3.根据权利要求2所述的信贷风险预测方法,其特征在于,所述标准化处理采用Z

score标准化处理。4.根据权利要求1所述的信贷风险预测方法,其特征在于,按照以下步骤得到预测月份跨度为N时待测对象的风险评级将预处理后的基准月之后N个月的待测对象的历史运营数据构成评级集合x'={x
n
},n=[1,2,

,N],x
n
表示基准月之后第n个月的待测对象的历史运营数据;对所述评级集合x'中每月的历史运营数据x
n
分别进行人工评级,按照评级结果划分月度信贷风险等级为低风险、中风险、高风险三档,具体为:从评级集合x'中的各类指标中选定若干核心指标,并为各核心指标分别设定阶梯性阈值,针对评级集合x'中的历史运营数据x
n
,当所述历史运营数据x
n
中的核心指标超过相应的阶梯性阈值时,则分别在基准月之后第n个月的总风险值上累计相应分数;当基准月之后第n个月的总风险值属于第一区间时,记该月度信贷风险等级为低风险;当基准月之后第n个月的总风险值属于第二区间时,记该月度信贷风险等级为中风险;当基准月之后第n个月的总风险值属于第三区间时,记该月度信贷风险等级为高风险;取N个月的整体风险评级为基准月之后N个月的月度信贷风险评级中的最大值,即5.根据权利要求1所述的信贷风险预测方法,其特征在于,将基准月T、输入月份跨度M及预测月份跨度N...

【专利技术属性】
技术研发人员:黄开胜张有容袁宏
申请(专利权)人:浙江清华长三角研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1