当前位置: 首页 > 专利查询>谢首鹏专利>正文

一种基于机器学习算法的债券风险预测方法及系统技术方案

技术编号:16380474 阅读:36 留言:0更新日期:2017-10-15 15:22
本发明专利技术提供的基于机器学习算法的债券风险预测方法级系统,该方法获取并保存债券数据样本;运用统计学软件对债券数据样本进行预处理,得到预处理数据;运用多种机器学习算法对预处理数据进行建模,通过模型特异度、灵敏度和整体预测准确率3个指标,对每个机器学习算法建立的模型进行综合评估和比较,选出预测表现最好、最合适的模型;对所述建模步骤选出的模型进行调参和优化,得到最优模型;实时获取债券数据,并采用所述最优模型对所述债券数据进行预测。该方法能够对债券风险进行实时精准的预测、准确的判断和跟踪,有助于投资人及时掌握债券风险情况,并作出正确的投资决策,避免可能发生的债券违约损失,降低投资人的风险。

A bond risk prediction method and system based on machine learning algorithm

The invention provides a method for system prediction machine learning algorithm based on the method of bond risk, acquiring and saving bond data samples; using statistical software to preprocess the bond data sample preprocessing data; the use of a variety of machine learning algorithms to preprocess data modeling, the accuracy rate of 3 indicators by specificity, model the sensitivity and the overall forecast for comprehensive evaluation and comparison of each algorithm in machine learning model, choose the best prediction performance, the most appropriate model; to the selected modeling steps model parameter adjustment and optimization, the optimal model for bond; real-time data, and using the optimal model to predict the bond data. This method can predict, real-time accurate bond risk and accurate judgment and tracking, help investors to grasp the bond risk, and make the right investment decisions, to avoid possible debt default loss, reduce the risk of investors.

【技术实现步骤摘要】
一种基于机器学习算法的债券风险预测方法及系统
本专利技术属于大数据
,具体涉及一种基于机器学习算法的债券风险预测方法及系统。
技术介绍
金融市场的投资者,尤其商业银行、证券公司、保险机构、基金公司等,处于金融监管及风险控制的要求,有相当规模的资金用于购买固定收益类产品,债券是其中的重要投资标的。为了确保所投资的债券能带来稳定的利息收益,避免违约损失,投资人需要对其所投资的债券进行风险预警和跟踪预测,以买入优质的债券,并及时地卖出可能存在风险的债券。现有的债券风险预警或预测技术的主要运用债券发行人与风险相关的信息,如征信信息、财务数据、第三方信用评级报告及研究报告等进行判断,但这些方法或技术往往具有滞后性,当发行人出现了相关的风险事件之后,才能被投资人获知。信用评级机构也是在债券发行主体发生风险事件后才采取相关的降级措施,而不少投资机构由于不具备提前预测风险的能力或者预测能力不足,往往可能面临巨大的债券违约风险。同时,目前由于金融市场的复杂性和相关金融技术的缺乏,极少有金融机构能够对债券风险做出精准的预测和准确的判断。
技术实现思路
针对现有技术中的缺陷,本专利技术提供亟需提供一种基于机器学习算法的债券风险预测方法及系统,能够对债券风险做出精准的预测和准确的判断,降低投资人的风险。一种基于机器学习算法的债券风险预测方法,包括获取步骤:获取并保存债券数据样本;预处理步骤:运用统计学软件对债券数据样本进行预处理,得到预处理数据;建模步骤:运用多种机器学习算法对预处理数据进行建模,通过模型特异度、灵敏度和整体预测准确率3个指标,对每个机器学习算法建立的模型进行综合评估和比较,选出预测表现最好、最合适的模型;调参步骤:对所述建模步骤选出的模型进行调参和优化,得到最优模型;预测步骤:实时获取债券数据,并采用所述最优模型对所述债券数据进行预测。优选地,所述预处理步骤中预处理包括:对债券数据样本进行去重处理,保留同单一发行主体数据;运用多重随机插补方法,对去重处理后的数据进行随机插补。优选地,所述建模步骤中的机器学习算法包括逻辑回归、决策树、随机森林、支持向量机和神经网络中一种或几种组合。优选地,所述调参步骤中调参和优化包括:通过逐步调整风险厌恶水平,对所述建模步骤选出的模型进行迭代,找出使得灵敏度达到100%的最优风险厌恶水平,定义该厌恶水平对应的模型为所述最优模型。优选地,所述调参步骤之后、预测步骤之前还包括:检验步骤:运用蒙特卡洛模拟中的自助法,设定置信水平,对所述最优模型预测效果的稳定性进行检验。优选地,所述预测步骤还包括:采用所述最优模型对所述债券数据进行预测,将所述最优模型输出的概率值转化为风险值和风险标识,同时将所述风险值和风险标识返回至数据库;所述风险标识包括红、黄、绿3种,其中红、黄、绿对应的风险值逐渐减小。优选地,还包括:查询步骤:获取所述预测步骤对所述债券数据的预测结果,并与其对应发行的债券进行匹配;还根据输入的发行人名称或债券名称,查询对应发行人或债券的风险值和风险标识。优选地,所述查询步骤之后还包括:跟踪步骤:实时更新所述发行人或债券的风险值和风险标识,并对所述发行人或债券的风险值和风险标识进行实时跟踪。基于机器学习算法的债券风险预测系统,运行上述基于机器学习算法的债券风险预测方法;包括:金融资讯终端、数据库、服务器和用户终端;所述金融资讯终端上存储有各个发行人的债券数据;所述服务器上设有获取单元、预处理单元、建模单元、调参单元、和预测单元:所述获取单元用于从金融资讯终端获取并保存债券数据样本;所述预处理单元用于运用统计学软件对债券数据样本进行预处理,得到预处理数据;所述建模单元用于运用多种机器学习算法对预处理数据进行建模,通过模型特异度、灵敏度和整体预测准确率3个指标,对每个机器学习算法建立的模型进行综合评估和比较,选出预测表现最好、最合适的模型;所述调参单元用于对所述建模单元选出的模型进行调参和优化,得到最优模型;所述预测单元用于实时获取债券数据,并采用所述最优模型对所述债券数据进行预测,并将预测结果发送给数据库;所述数据库用于保存所述预测结果。所述用户终端供用户输入的发行人名称或债券名称,查询数据库中对应发行人或债券的风险值和风险标识。优选地,所述服务器上还设有检验单元,所述检验单元运用蒙特卡洛模拟中的自助法,设定置信水平,对所述最优模型预测效果的稳定性进行检验。由上述技术方案可知,本专利技术提供的基于机器学习算法的债券风险预测方法及系统,能够对债券风险进行实时精准的预测、准确的判断和跟踪,有助于投资人及时掌握债券风险情况,并作出正确的投资决策,避免可能发生的债券违约损失,降低投资人的风险。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。图1为基于机器学习算法的债券风险预测方法的流程图。图2为基于机器学习算法的债券风险预测系统的系统框图。图3为混淆矩阵的定义。图4为实施例中21个差异显著财务指标的P值。图5为实施例中12个差异不显著财务指标的P值。图6为实施例中全国各省份债券发行人信用风险分布图。具体实施方式下面将结合附图对本专利技术技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,因此只作为示例,而不能以此来限制本专利技术的保护范围。需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本专利技术所属领域技术人员所理解的通常意义。实施例:一种基于机器学习算法的债券风险预测方法,如图1-6所示,包括获取步骤:获取并保存债券数据样本;预处理步骤:运用统计学软件对债券数据样本进行预处理,得到预处理数据;建模步骤:运用多种机器学习算法对预处理数据进行建模,通过模型特异度、灵敏度和整体预测准确率3个指标,对每个机器学习算法建立的模型进行综合评估和比较,选出预测表现最好、最合适的模型;调参步骤:对所述建模步骤选出的模型进行调参和优化,得到最优模型;预测步骤:实时获取债券数据,并采用所述最优模型对所述债券数据进行预测。该方法的工作原理是借助大数据分析技术和机器学习算法,通过债券发行主体的财务数据,寻找出能够最大限度识别债券风险高低的算法模型,从而实现债券风险的识别及预警。能够对债券风险进行实时精准的预测、准确的判断和跟踪,有助于投资人及时掌握债券风险情况,并作出正确的投资决策,避免可能发生的债券违约损失,降低投资人的风险。所述预处理步骤中预处理包括:对债券数据样本进行去重处理,保留同单一发行主体数据;运用多重随机插补方法,对去重处理后的数据进行随机插补,以完善数据。所述建模步骤中的机器学习算法包括逻辑回归、决策树、随机森林、支持向量机和神经网络中一种或几种组合。所述调参步骤中调参和优化包括:通过逐步调整风险厌恶水平,对所述建模步骤选出的模型进行迭代,找出使得灵敏度达到100%的最优风险厌恶水平,定义该厌恶水平对应的模型为所述最优模型。所述调参步骤之后、预测步骤之前还包括:检验步骤:运用蒙特卡洛模拟中的自助法,设定置信水平,对所述最优模型预测效果的稳定性进行检验,对检验后的具有良好本文档来自技高网...
一种基于机器学习算法的债券风险预测方法及系统

【技术保护点】
一种基于机器学习算法的债券风险预测方法,其特征在于,包括获取步骤:获取并保存债券数据样本;预处理步骤:运用统计学软件对债券数据样本进行预处理,得到预处理数据;建模步骤:运用多种机器学习算法对预处理数据进行建模,通过模型特异度、灵敏度和整体预测准确率3个指标,对每个机器学习算法建立的模型进行综合评估和比较,选出预测表现最好、最合适的模型;调参步骤:对所述建模步骤选出的模型进行调参和优化,得到最优模型;预测步骤:实时获取债券数据,并采用所述最优模型对所述债券数据进行预测。

【技术特征摘要】
1.一种基于机器学习算法的债券风险预测方法,其特征在于,包括获取步骤:获取并保存债券数据样本;预处理步骤:运用统计学软件对债券数据样本进行预处理,得到预处理数据;建模步骤:运用多种机器学习算法对预处理数据进行建模,通过模型特异度、灵敏度和整体预测准确率3个指标,对每个机器学习算法建立的模型进行综合评估和比较,选出预测表现最好、最合适的模型;调参步骤:对所述建模步骤选出的模型进行调参和优化,得到最优模型;预测步骤:实时获取债券数据,并采用所述最优模型对所述债券数据进行预测。2.根据权利要求1所述的基于机器学习算法的债券风险预测方法,其特征在于,所述预处理步骤中预处理包括:对债券数据样本进行去重处理,保留同单一发行主体数据;运用多重随机插补方法,对去重处理后的数据进行随机插补。3.根据权利要求1所述的基于机器学习算法的债券风险预测方法,其特征在于,所述建模步骤中的机器学习算法包括逻辑回归、决策树、随机森林、支持向量机和神经网络中一种或几种组合。4.根据权利要求1所述的基于机器学习算法的债券风险预测方法,其特征在于,所述调参步骤中调参和优化包括:通过逐步调整风险厌恶水平,对所述建模步骤选出的模型进行迭代,找出使得灵敏度达到100%的最优风险厌恶水平,定义该厌恶水平对应的模型为所述最优模型。5.根据权利要求1所述的基于机器学习算法的债券风险预测方法,其特征在于,所述调参步骤之后、预测步骤之前还包括:检验步骤:运用蒙特卡洛模拟中的自助法,设定置信水平,对所述最优模型预测效果的稳定性进行检验。6.根据权利要求1所述的基于机器学习算法的债券风险预测方法,其特征在于,所述预测步骤还包括:采用所述最优模型对所述债券数据进行预测,将所述最优模型输出的概率值转化为风险值和风险标识,同时将所述风险值和风险标识返回至数据库;所述风险标识包括红、黄、绿3...

【专利技术属性】
技术研发人员:谢首鹏
申请(专利权)人:谢首鹏
类型:发明
国别省市:江苏,32

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1