一种基于元学习和改进的Catboost算法的债券违约预测方法技术

技术编号:34478855 阅读:42 留言:0更新日期:2022-08-10 08:54
本发明专利技术涉及一种债券违约预测识别的技术,具体涉及一种基于元学习和改进的Catboost算法的债券违约预测方法,属于金融信息数据管理技术。首先经过K近邻算法进行缺失值填补和标准化处理,然后利用基于元学习框架的显式梯度学习数据增强方法对不平衡数据进行处理,得到经过不平衡处理后的数据,接着利用相关分析和随机森林算法进行特征筛选,最后利用以改进的GHMNALoss为损失函数的Catboost算法模型进行训练,得到每个债券的违约预测结果。本发明专利技术能避免对不平衡数据集导致的债券违约预测效果不佳的问题,并对不同类型的债券违约预测都能达到较好的结果。达到较好的结果。达到较好的结果。

【技术实现步骤摘要】
一种基于元学习和改进的Catboost算法的债券违约预测方法


[0001]本专利技术涉及一种债券违约预测识别的技术,具体涉及一种基于元学习和改进的Catboost算法的方法,属于金融信息数据管理技术。

技术介绍

[0002]违约风险处于历史最高水平,债券展期规模大幅增加,债券市场总体的信用风险水平也相对增加,债券的违约形式也不断多样化。截止2021年末,从债券规模来看,我国债券市场中公司债规模居首,占比将近61%,从违约规模来看,2021年的违约债券仍延续往年,以公司债、私募债居多,二者合计占比约62%,从债券违约数据的不平衡程度来看,正负例之间的比例超过1:100,具有严重的不平衡问题。因此,债券违约数据具有严重的不平衡程度,结合现实意义和数据特点,对债券违约预测进行研究是十分有意义的。目前,许多研究者在债券违约方面做了大量的研究,提出了许多实用的识别方法,主要包括:
[0003](1)专利《一种信用评级违约概率测度与风险预警方法》(公开号 CN110110981A)考虑了非信用因素波动对违约概率的影响,添加了定性指标建立了一个综合的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于元学习和改进的Catboost算法的债券违约预测方法,其特征在于:该方法包括如下步骤:步骤一:数据预处理(1.1)将债券违约相关数据集作为输入,首先进行缺失值的处理,采取K近邻算法进行缺失值的填补;(1.2)对进行过缺失值处理后的数据进行最大最小归一化的标准化处理;步骤二:特征工程(2.1)对进行预处理后的数据集采用基于元学习的显式梯度数据增强(EGLA)进行不平衡数据的处理;(2.2)对于经过不平衡处理后的数据,绘制相关系数的热力图判断解释变量之间的相关系数,采取措施消除共线性,剔除其中一个特征;(2.3)对删除部分共线性特征后的数据使用随机森林算法来对特征变量的重要性进行筛选留信息增益值排名前20的特征变量;(2.4)将经过相关分析和随机森林筛选的数据作为模型的最终输入;步骤三:债券违约预测(3.1)对上述得到的数据集,进行训练集和测试集的划分;(3.2)利用改进的Catboost算法模型进行训练预测。2.根据权利要求1所述的基于元学习和改进的Catboost算法的债券违约预测方法,其特征在于:所述的步骤二(2.1)中:通过复制位于高不确定性区域的少数类样本实例来合成新的样本,复制其中训练集中的实例来实现得到新数据集Z
synth
,即D
synth
=(Z
synth
,Y
synth
),具体有:D
synth
={(x,y)∈D
train
|y=1,C
θ
(x)≤c};通过复制D
train
中的实例来实现合成集D
synth
的初始化,而复制的少数类的样本由初始分类器模型C
θ
确定。3.据权利要求1所述的基于元学习和改进的Catboost算法的债券违约预测方法,其特征在于:所述的步骤二(2.1)中:对分类器模型C
θ
进行训练,具体的梯度更新为:其中η1为步长;通过计算Z
synth
上的损失函数并执行一个或者多个梯度下降更新来实现分类器模型C
θ
的决策边界的调整。4.据权利要求1所述的基于元学习和改进的Catboost算法的债券违约预测方法,其特征在于:所述的步骤二(2.1)中:在验证集D
valid
上计算分类器的损失,即L(D
valid
;C
θ
),并通过计算损失执行梯度下降来改变Z
synth
的值;Z
synth
的具体更新为...

【专利技术属性】
技术研发人员:张永全杨秀银武鑫
申请(专利权)人:浙江财经大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1