一种基于持续学习的信用风险预测方法技术

技术编号:38230244 阅读:14 留言:0更新日期:2023-07-25 17:58
本发明专利技术涉及信用风险预测技术,其公开了一种基于持续学习的信用风险预测方法,在隐私保护导致的样本量有限的情况下,持续性地增强模型的性能,提高预测的准确性。本发明专利技术采用持续学习策略训练各个任务的预测模型,上一个任务的模型训练好后,提取模型的参数知识传递到下一个任务,从而辅助下一个任务的模型训练;此外,本发明专利技术在模型应用中还融入了三支决策,即首先根据各任务模型对相应任务训练数据集中样本预测结果的置信度分布情况,自适应设置模型的三支决策阈值对,在实际应用中,收到待预测信息后,采用当前最新模型输出对待预测信息的风险评估结果并统计置信度,而后根据三支决策阈值对执行决策,实现对不确定性样本的延迟决策处理,以便更好地控制信用风险。以便更好地控制信用风险。以便更好地控制信用风险。

【技术实现步骤摘要】
一种基于持续学习的信用风险预测方法


[0001]本专利技术涉及信用风险预测技术,具体涉及一种基于持续学习的信用风险预测方法。

技术介绍

[0002]在科学信息时代,大数据不再只是单纯的数据,已成为重要的生产因素,渗透到当今每一个领域。数据生成、收集、存储、传输和利用遍布各个行业,在为我们带来了便利的同时,高度信息化的数据也增加泄露个人私密信息的风险,当前大数据时代的个人隐私保护逐渐引起了大家的重视。
[0003]金融市场的交易对象不是普通商品,而是货币资金及其衍生物,隐私保护在金融市场中有着重大意义。在信用贷款领域,贷款人信用作为基础,通过借贷关系和委托代理关系,实现了资金的使用权和所有权的暂时分离或有条件的让渡。在这一过程中,银行等金融机构用信用风险,换取未来的利息收益。这里的信用风险又称违约风险,是指借款人、证券发行人或交易对方因种种原因,不愿或无力履行合同条件而构成违约,致使银行、投资者或交易对方遭受损失的风险。依据预测风险的大小,金融机构决定是否为贷款人放贷,贷款审批一般情况的流程如图1。由于信用风险预测的准确性与机构的盈亏有直接关系,如何构建信用风险评估模型一直以来都是信用贷款领域重要的研究话题。
[0004]构建信用风险评估模型的传统做法是,针对整个审批流程中的每个阶段根据现成的数据分别构建静态模型,而后再利用这些静态模型预测样本类别,参见图2。在个人隐私保护越发严格导致的样本有限的金融市场中,传统的这一预测方式受到了很大的限制。由于金融市场上交易对象和交易方式的特殊性,金融市场监管者格外重视参与者的隐私保护。在信贷领域,银行等第三方放贷机构受制于隐私保护约束,无法永久保留借款人信息,这些信息必须在特定时间之后被销毁,这导致可用于训练模型的样本量受到限制。而在隐私保护的背景下,如何基于少量样本不断地增强模型性能,传统的信用风险预测方法还没能解决这一问题。
[0005]此外,受制于隐私保护这一现状,可用的数据量较少,很难保证所构建模型的预测准确性。传统的信用风险预测方法采用的是二支决策,即直接划分样本为某个确定的类别,这忽视了对样本误分类的控制,从而导致了目标机构仍然面临较高的信用风险。

技术实现思路

[0006]本专利技术所要解决的技术问题是:提出一种基于持续学习的信用风险预测方法,在隐私保护导致的样本量有限的情况下,持续性地增强模型的性能,提高预测的准确性。并进一步控制预测结果的不确定性,便于金融机构控制面临的信用风险。
[0007]本专利技术解决上述技术问题采用的技术方案是:
[0008]一种基于持续学习的信用风险预测方法,包括以下步骤:
[0009]A1、构建信用风险预测模型并初始化;
[0010]A2、构建当前训练轮次的训练数据集,并基于当前训练轮次的训练数据集对信用风险预测模型进行训练;
[0011]A3、利用训练获得的当前训练轮次的信用风险预测模型,执行信用风险预测任务;
[0012]A4、判断是否到达设定的模型更新周期,若是,则返回步骤A2,进入下一轮训练,否则返回步骤A3;
[0013]其中,步骤A2包括如下步骤:
[0014]A21、判断训练是否为首个训练任务,若是,则执行步骤A22,否则,执行步骤A23;
[0015]A22、对当前已有的样本数据进行预处理,构建首个训练轮次的训练数据集;利用首个训练轮次的训练数据集,对初始化的信用风险预测模型进行训练,获得首个训练轮次对应的信用风险预测模型,执行步骤A24;
[0016]A23、对更新周期时间段内,新增的样本数据进行预处理,获得当前训练轮次的训练数据集;利用当前训练轮次的训练数据集,对上一训练轮次获得的信用风险预测模型进行增量训练,且在增量训练过程中,利用从上一训练轮次获得的信用风险预测模型提取的参数知识进行参数寻优,获得当前训练轮次对应的信用风险预测模型,执行步骤A24;
[0017]A24、提取训练获得的当前训练轮次的信用风险预测模型的参数知识。
[0018]进一步的,步骤A1中,所述信用风险预测模型采用包括一层输入层、若干隐藏层和一层输出层的全连接神经网络模型。
[0019]进一步的,步骤A22和A23中,所述预处理包括:处理缺失数据,删除冗余特征、构建新特征和平衡数据类别。
[0020]进一步的,步骤A24中,通过EWC(Elastic Weight Consolidation,弹性权重巩固)方法提取训练获得的当前训练轮次的信用风险预测模型的参数知识。
[0021]进一步的,步骤A4中,步骤A4中,所述模型更新周期为固定时间周期或者当前可用于增量训练的样本数据达到一定数据量时作为一个更新周期。
[0022]进一步的,步骤A23中,所述利用从上一训练轮次获得的信用风险预测模型提取的参数知识进行参数寻优,具体包括:
[0023]将当前轮次训练任务中模型的参数与从上一轮次训练任务获得的信用风险预测模型提取的参数知识进行比较,将二者的差异纳入当前轮次模型训练任务的模型参数寻优的损失函数中,并使得上一轮次训练任务获得的信用风险预测模型中权重越大的参数在当前轮次训练任务中的损失函数中保持越大的权重。
[0024]进一步的,步骤A3包括如下步骤:
[0025]A31、以待预测信用风险信息作为输入,利用训练获得的当前训练轮次的信用风险预测模型,输出信用风险类别的评估结果;
[0026]A32、根据信用风险类别评估结果的置信度,结合预设的针对训练获得的当前训练轮次的信用风险预测模型的三支决策阈值对,将待预测信用风险信息划分至正域、负域或者边界域中,并执行如下决策:
[0027]若划分至正域,则执行预设的与低信用风险相对应的决策,若划分至负域则执行预设的与高信用风险相对应的决策,若划分至边界域,则等待信用风险预测模型经过下一轮次训练后,再次对此待预测信用风险信息执行信用风险预测。
[0028]进一步的,步骤A32中,预设针对当前训练轮次的信用风险预测模型的三支决策阈
值对方法包括:
[0029]将当前训练轮次的训练数据集中的样本数据输入至训练获得的当前训练轮次的信用风险预测模型中,获得针对各样本数据的信用风险类别评估结果,并统计各评估结果的置信度,然后将各评估结果的置信度进行排序;
[0030]依据预先设定的进入边界域的样本数据数量所占输入的总样本数据数量的比例,从排序后的置信度序列中获得两个置信度边界点;
[0031]将所述两个置信度边界点中置信度相对较低的置信度边界点作为下限阈值,将所述两个置信度边界点中置信度相对较高的置信度边界点作为上限阈值,所述下限阈值和上限阈值组成三支决策阈值对。
[0032]进一步的,步骤A32中,所述根据信用风险类别评估结果的置信度,结合预设的针对训练获得的当前训练轮次的信用风险预测模型的三支决策阈值对,将待预测信用风险信息划分至正域、负域或者边界域中,具体包括:
[0033]将待预测信用风险信息的信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于持续学习的信用风险预测方法,其特征在于,包括以下步骤:A1、构建信用风险预测模型并初始化;A2、构建当前训练轮次的训练数据集,并基于当前训练轮次的训练数据集对信用风险预测模型进行训练;A3、利用训练获得的当前训练轮次的信用风险预测模型,执行信用风险预测任务;A4、判断是否到达设定的模型更新周期,若是,则返回步骤A2,进入下一轮训练,否则返回步骤A3;其中,步骤A2包括如下步骤:A21、判断训练是否为首个训练任务,若是,则执行步骤A22,否则,执行步骤A23;A22、对当前已有的样本数据进行预处理,构建首个训练轮次的训练数据集;利用首个训练轮次的训练数据集,对初始化的信用风险预测模型进行训练,获得首个训练轮次对应的信用风险预测模型,执行步骤A24;A23、对更新周期时间段内,新增的样本数据进行预处理,获得当前训练轮次的训练数据集;利用当前训练轮次的训练数据集,对上一训练轮次获得的信用风险预测模型进行增量训练,且在增量训练过程中,利用从上一训练轮次获得的信用风险预测模型提取的参数知识进行参数寻优,获得当前训练轮次对应的信用风险预测模型,执行步骤A24;A24、提取训练获得的当前训练轮次的信用风险预测模型的参数知识。2.如权利要求1所述的一种基于持续学习的信用风险预测方法,其特征在于,步骤A1中,所述信用风险预测模型采用包括一层输入层、若干隐藏层和一层输出层的全连接神经网络模型。3.如权利要求1所述的一种基于持续学习的信用风险预测方法,其特征在于,步骤A22和A23中,所述预处理包括:处理缺失数据,删除冗余特征、构建新特征和平衡数据类别。4.如权利要求1所述的一种基于持续学习的信用风险预测方法,其特征在于,步骤A24中,通过EWC方法提取训练获得的当前训练轮次的信用风险预测模型的参数知识。5.如权利要求1所述的一种基于持续学习的信用风险预测方法,其特征在于,步骤A4中,所述模型更新周期为固定时间周期或者当前可用于增量训练的样本数据达到一定数据量时作为一个更新周期。6.如权利要求1

5任意一项所述的一种基于持续学习的信用风险预测方法,其特征在于,步骤A23中,所述利用从上一训练轮次获得的信用风险预测模型提取的参数知识进行参数寻优,具体包括:将当前轮次训练任务中模型的参数与从上一轮次训练任务获得的信用风险预测模型提取的参数知识进行比较,将二者的差异纳入当前轮次模型训练任务的模型参数寻优的损失函数中,并使得上一轮次训练任务获得的信用风险预测模型...

【专利技术属性】
技术研发人员:杨新吴美君陈珑升刘贵松黄鹂寇纲
申请(专利权)人:喀什地区电子信息产业技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1