一种基于债券估值数据与集成机器学习的债券违约预测方法技术

技术编号:24686750 阅读:90 留言:0更新日期:2020-06-27 08:52
本发明专利技术提供一种基于债券估值数据与集成机器学习的债券违约预测方法,包括以下步骤:(1)获取债券估值数据和基本资料数据;(2)特征工程,清洗数据;(3)K折交叉验证选择最优模型参数;(4)训练模型;(5)使用训练好的模型进行违约预测;(6)集成模型,得到风险评分。其通过使用结构化的债券估值数据进行违约预测,降低使用非结构化数据的处理复杂度,增强所用数据与债券的相关性;通过运用K折交叉验证选择最优的模型参数,避免人为选参造成的模型效果差的问题;通过集成多个不同特点的模型的预测结果,降低只用个别模型预测产生错误的概率;通过给出不同模型预测的违约概率和集成的风险评分,辅助投资者进行投资决策。

A bond default prediction method based on bond valuation data and integrated machine learning

【技术实现步骤摘要】
一种基于债券估值数据与集成机器学习的债券违约预测方法
本专利技术属于金融风险评估领域,具体涉及一种基于债券估值数据与集成机器学习的债券违约预测方法。
技术介绍
债券作为投资者重要的融资工具,连续爆发的违约事件损害了投资者的利益,影响了债券市场融资功能的发挥。为了更好地维护投资者的利益,保护投资者合法权益,需要一种能够提前预测债券违约风险的方法,在债券违约前预警,以辅助投资者进行债券投资决策,避免财产遭受严重损失。到目前为止,市场上已经有一些利用机器学习进行债券违约预测的方法,这些方法主要使用与债券本身无关的数据,例如债券主体相关的财务数据、主体所在行业数据、地区的财政数据、宏观经济数据、市场舆情数据和征信数据等。将这些数据结构化、清洗之后,使用特定参数的机器学习模型进行训练,最后对新债券是否违约进行预测。这些方法主要使用和债券本身无关的非结构化数据,这些数据和债券的特征没有直接联系,而且需要花费大量的时间成本和人力成本将非结构化数据处理成机器学习模型可用的结构化数据。此外人为选择机器学习模型的参数,不恰当的选择会严重影响模型的效本文档来自技高网...

【技术保护点】
1.一种基于债券估值数据与集成机器学习的债券违约预测方法,其特征在于,该方法包括以下步骤:/n(1)获取债券估值数据和基本资料数据,用于得到该方法所使用的训练样本数据;/n(2)特征工程,清洗数据,用于处理步骤(1)中得到的样本数据,作为机器学习模型的输入;/n(3)K折交叉验证选择机器学习的模型参数,用于选择最优的机器学习参数组合;/n(4)训练模型,用于得到最终进行债券违约预测的机器学习模型;/n(5)使用训练好的多个模型进行违约预测,用于输出每个模型对输入债券预测的违约概率;/n(6)集成模型,得到风险评分,用于集成多个模型对输入债券的违约预测的结果。/n

【技术特征摘要】
1.一种基于债券估值数据与集成机器学习的债券违约预测方法,其特征在于,该方法包括以下步骤:
(1)获取债券估值数据和基本资料数据,用于得到该方法所使用的训练样本数据;
(2)特征工程,清洗数据,用于处理步骤(1)中得到的样本数据,作为机器学习模型的输入;
(3)K折交叉验证选择机器学习的模型参数,用于选择最优的机器学习参数组合;
(4)训练模型,用于得到最终进行债券违约预测的机器学习模型;
(5)使用训练好的多个模型进行违约预测,用于输出每个模型对输入债券预测的违约概率;
(6)集成模型,得到风险评分,用于集成多个模型对输入债券的违约预测的结果。


2.根据权利要求1所述的一种基于债券估值数据与集成机器学习的债券违约预测方法,其特征在于,所述的权利要求1中的步骤(1),是从中债金融估值中心获取债券估值数据和基本资料数据。


3.根据权利要求2所述的一种基于债券估值数据与集成机器学习的债券违约预测方法,其特征在于,所述的从中债金融估值中心获取债券估值数据和基本资料数据,包括获取正常到期债券和违约债券的估值数据和基本资料数据,获取的所有数据作为训练样本集合。


4.根据权利要求3所述的一种基于债券估值数据与集成机器学习的债券违约预测方法,其特征在于,所述的获取的所有数据作为训练样本集合,在训练样本集合中,正常到期债券样本为正样本,违约债券样本为负样本。


5.根据权利要求3所述的一种基于债券估值数据与集成机器学习的债券违约预测方法,其特征在于,所述的获取的所有数据作为训练样本集合,样本的特征包括类别特征和数值特征。


6.根据权利要求5所述的一种基于债券估值数据与集成机器学习的债券违约预测方法,其特征在于,所述的样本的类别特征包括:证券类型代码、证券品种代码、证券类别代码、证券性质代码、证券期限单位、计息方式代码、担保方式代码、含权标志、城投债标志、付息规则标志、机构类型代码、组织形式、是否上市、地区代码、行业代码、最新主体信用评级编号、最新债项信用评级编号和曲线评级编号。


7.根据权利要求5所述的一种基于债券估值数据与集成机器学习的债券违约预测方法,其特征在于,所述的样本的数值特征包括:证券期限、票面利率、发行时利差、付息频率、发行价格、实际发行总额、本期本金值、注册资本、修正久期、凸性、基点价值、估值全价、估值净价、估价收益率、实际待偿期和上一个工作日净价离差。


8.根据权利要求1所述的一种基于债券估值数据与集成机器学习的债券违约预测方法,其特征在于,所述的权利要求1中的步骤(2)包括:
(1)空值处理;
(2)特征合并;
(3)类别特征one-hot(独热)编码;
(4)对每一个特征进行标准化。


9.根据权利要求8所述的一种基于债券估值数据与集成机器学习的债券违约预测方法,其特征在于,所述的空值处理,包括数值特征空值处理和类别特征空值处理。


10.根据权利要求9所述的一种基于债券估值数据与...

【专利技术属性】
技术研发人员:殷宪晨
申请(专利权)人:中债金融估值中心有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1