【技术实现步骤摘要】
基于循环神经网络的信贷风险预测方法、装置和存储介质
[0001]本公开属于数据处理
,特别涉及一种基于循环神经网络的信贷风险预测方法、装置和存储介质。
技术介绍
[0002]对待测对象信贷情况的监控在风控场景下尤为重要,依据待测对象一段时间内的运营数据,预测其未来发生风险的可能性,将有助于监控方提前甄别、对症下药、规避风险、提高收益。
[0003]现有监控方案主要有两种:一是基于专家经验评价,二是基于决策树或线性分类器。
[0004]基于专家经验评价的监控方案的问题有:
[0005]1、效率低下:大量数据报表的整理工作流程繁琐、错误率高,并且需要人工研判信贷风险,费时费力。
[0006]2、评价滞后:目前往往采用同步指标评价待测用户的信贷风险,当一些核心指标(财务数据、还款、盘点、征信等)出现异常时,则风险已经同步发生,无法实现预判的目标。
[0007]3、主观性强:依据专家经验建立的信贷风险评价体系极度依赖专家的经验,无法挖掘数据背后的潜在联系,不够客观理性。
[0008]基于决策树或线性分类器的监控方案的问题有:
[0009]1、时序性差:对于时序的待测对象运营数据,无法依据前后若干月数据的变化关联挖掘潜在的风险,无法依据数据时间的远近给予不同的重视程度。
[0010]2、灵活性差:无法灵活地变换输入与预测月份的跨度,一旦需要延长原月份跨度,需要彻底改变原有算法结构。
技术实现思路
[0011]本公开旨在至少解决现有技术中存在的
【技术保护点】
【技术特征摘要】
1.一种基于循环神经网络的信贷风险预测方法,其特征在于,包括:设定任意月份为基准月T,对基准月及基准月之前M
‑
1个月和基准月之后N个月的待测对象的历史运营数据进行预处理,将预处理后的基准月及其之前M
‑
1个月的待测对象的历史运营数据构成输入集合x,对预处理后的基准月之后N个月的待测对象的历史运营数据进行人工评估,得到预测月份跨度为N时待测对象的风险评级将基准月T、输入月份跨度M及预测月份跨度N进行取值范围内的遍历,得到样本集,每个样本包括选定的输入月份跨度、预测月份跨度、待测对象的输入集合以及对应的风险评级,按设定比例将样本集划分为训练集和测试集;构建基于循环神经网络的信贷风险预测模型,利用训练集对信贷风险预测模型进行训练,以确定在任意输入月份跨度M、预测月份跨度N下,输入集合x与风险评级之间的映射关系,并输出预测结果y,将训练完毕的循环神经网络在测试集上进行测试,得到训练完毕的信贷风险预测模型;按照监控方需求任意设定输入月份跨度和预测月份跨度获取待测对象当前月及其之前个月的运营数据作为待预测数据,对其进行预处理后,得到待测对象个月的输入集合将所述输入集合输入训练完毕的信贷风险预测模型,得到距离当前月之后个月的信贷风险情况的预测结果y,从而确定待测对象的信贷风险情况。2.根据权利要求1所述的信贷风险预测方法,其特征在于,对所述运营数据进行的预处理包括对所述运营数据依次进行集成、清洗、补全、标准化和PCA降维处理。3.根据权利要求2所述的信贷风险预测方法,其特征在于,所述标准化处理采用Z
‑
score标准化处理。4.根据权利要求1所述的信贷风险预测方法,其特征在于,按照以下步骤得到预测月份跨度为N时待测对象的风险评级将预处理后的基准月之后N个月的待测对象的历史运营数据构成评级集合x'={x
n
},n=[1,2,
…
,N],x
n
表示基准月之后第n个月的待测对象的历史运营数据;对所述评级集合x'中每月的历史运营数据x
n
分别进行人工评级,按照评级结果划分月度信贷风险等级为低风险、中风险、高风险三档,具体为:从评级集合x'中的各类指标中选定若干核心指标,并为各核心指标分别设定阶梯性阈值,针对评级集合x'中的历史运营数据x
n
,当所述历史运营数据x
n
中的核心指标超过相应的阶梯性阈值时,则分别在基准月之后第n个月的总风险值上累计相应分数;当基准月之后第n个月的总风险值属于第一区间时,记该月度信贷风险等级为低风险;当基准月之后第n个月的总风险值属于第二区间时,记该月度信贷风险等级为中风险;当基准月之后第n个月的总风险值属于第三区间时,记该月度信贷风险等级为高风险;取N个月的整体风险评级为基准月之后N个月的月度信贷风险评级中的最大值,即5.根据权利要求1所述的信贷风险预测方法,其特征在于,将基准月T、输入月份跨度M及预测月份跨度N...
【专利技术属性】
技术研发人员:黄开胜,张有容,袁宏,
申请(专利权)人:浙江清华长三角研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。