基于Wasserstein分布式鲁棒优化的风险集成预测方法技术

技术编号:38137465 阅读:10 留言:0更新日期:2023-07-08 09:49
本发明专利技术实施例公开了基于Wasserstein分布式鲁棒优化的风险集成预测方法;预测方法包括步骤:S1、获取风险相关时序数据标的以及相应的外生变量数据;S2、选择单体预测模型,组成备选单体预测模型库;S3、将风险相关时序数据标的与外生变量数据转换为单体预测模型算法可读的数据结构;S4、将得到的数据结构划分为训练集和测试集;S5、利用训练集对单体预测模型分别进行训练;S6、基于训练好的单体预测模型,获取每个单体预测模型在测试集上的样本外预测输出和对应的预测误差;S7、利用各个单体预测模型在测试集上的预测误差数据,构造基于Wasserstein分布式鲁棒优化技术的模糊集;S8、确定最佳的集成策略,得到风险集成预测模型,对风险进行预测。对风险进行预测。对风险进行预测。

【技术实现步骤摘要】
基于Wasserstein分布式鲁棒优化的风险集成预测方法


[0001]本专利技术属于数据处理
,特别属于时序数据处理
,具体涉及基于Wasserstein分布式鲁棒优化的风险集成预测方法。

技术介绍

[0002]为了准确地对风险进行预测,已有研究开发和使用了大量的计量经济学模型和机器学习模型。但是大量文献的实证研究结果表明,任何一个单预测模型可能不足以识别风险相关时序数据的所有特征,特别是对具有高度复杂性和不确定性的风险相关时序数据,很难找到一个预测模型能够挖掘出这一类复杂数据背后的客观规律。而集成预测模型,即将多个方法、模型以一定的搭配组合形式融合为一个预测模型能够充分利用各个方法与模型各自的优点,互相补充,利用每个模型方法的独特特性,进而通过集成的思想以获得新的有价值信息,最终提高预测模型的预测精度和稳定性,达到明显改善预测效果的目的。
[0003]集成策略可以分为线性或非线性、等权或非等权等,常用的集成策略主要有简单平均和加权平均。在异质集成预测中,简单平均和非线性策略被经常用来进行模型结果的集成,例如可以利用多目标粒子群算法实现航运指数的非线性集成预测;可以利用分解技术与预测方法相结合的半异构方法进行原油价格预测。在同质集成预测中,简单平均集成策略最受欢迎,其主要原因在于简单平均策略不需要进行额外的参数估计,对估计误差不敏感;例如可以利用简单平均策略分别对风险相关的市场收益率和汇率走势进行预测研究。
[0004]近年来,研究人员在集成预测的集成策略构造和单体预测模型选择上已取得长足进展,但是对集成预测模型的鲁棒性却少有探究。由于风险相关时序数据容易受到各种事件的影响,如突发灾害、政策法规变化等,使得风险相关时序数据往往具有明显的尖峰厚尾、异方差性、波动聚集性和杠杆效应特征,进而使得已有的风险集成预测模型很容易被现实生活中的种种微小扰动所影响。当前,不管是基于计量经济学的传统预测模型还是基于人工智能算法的人工智能预测模型,甚至是集成预测模型都普遍面临低鲁棒性的问题。在特定数据集上测试性能良好的预测模型,很容易被实际风险相关时序数据中的少量噪声或突发事件所影响,导致模型出现高置信度的错误预测。
[0005]因此,现有的集成预测模型难以有效应对风险相关时序数据中的异常走势,对传统集成预测模型的鲁棒性、可靠性、和竞争性造成了严重的威胁。

技术实现思路

[0006]有鉴于此,一方面,一些实施例公开了基于Wasserstein分布式鲁棒优化的风险集成预测方法,包括步骤:
[0007]S1、获取风险相关时序数据标的以及相应的外生变量数据;
[0008]S2、选择单体预测模型,组成备选单体预测模型库;
[0009]S3、将风险相关时序数据标的与外生变量数据转换为单体预测模型算法可读的数
据结构;
[0010]S4、将得到的数据结构划分为训练集和测试集;
[0011]S5、利用训练集对单体预测模型分别进行训练;
[0012]S6、基于训练好的单体预测模型,获取每个单体预测模型在测试集上的样本外预测输出和对应的预测误差;
[0013]S7、利用各个单体预测模型在测试集上的预测误差数据,构造基于Wasserstein分布式鲁棒优化技术的模糊集;
[0014]S8、确定最佳的集成策略,得到风险集成预测模型,对风险进行预测。
[0015]进一步,一些实施例公开的基于Wasserstein分布式鲁棒优化的风险集成预测方法,单体预测模型包括指数平滑模型、自回归综合移动平均模型、支持向量机模型、相关向量机模型、前馈神经网络模型、广义回归神经网络模型、极限学习机模型、随机森林模型、长短期记忆模型。
[0016]一些实施例公开的基于分布式鲁棒优化的风险集成预测方法,步骤S6包括:
[0017]在测试集上,将不同时刻的风险相关时序数据输入到训练好的各个单体预测模型,得到每个单体预测模型的预测误差结果。
[0018]进一步,一些实施例公开的基于Wasserstein分布式鲁棒优化的风险集成预测方法,步骤S7包括:
[0019]所有的预测误差结果形成经验分布;
[0020]基于经验分布,构建基于Wasserstein度量的模糊集。
[0021]进一步,一些实施例公开的基于分布式鲁棒优化的风险集成预测方法,步骤S7进一步包括:
[0022]基于Wasserstein度量的模糊集中的worst

case分布做优化,得到基于Wasserstein度量的分布式鲁棒优化模型。
[0023]一些实施例公开的基于分布式鲁棒优化的风险集成预测方法,步骤S6中,每个单体预测模型的预测误差结果表达为单体预测模型的预测值与实际值的差值,表达为:
[0024][0025]其中,是一个n维向量,表示在第t期所有单体预测模型的预测结果,即是一个n维向量,表示在第t期所有单体预测模型的预测结果,即表示第t期集成预测模型的输出值;表示第i种单体预测模型在第t期的预测结果;n表示单体预测模型库中共有n种单体预测模型;y
t
为时间序列第t(t=1,2,

,N)期的实际数值;e
t
为第t期所有单体预测模型的预测值与实际值的差值。
[0026]一些实施例公开的基于分布式鲁棒优化的风险集成预测方法,步骤S7中,基于Wasserstein度量的模糊集表达为:
[0027][0028]其中,表示随机变量的潜在分布,表示经验分布,ε为Wasserstein球的半径,Ξ表示样本空间。
[0029]一些实施例公开的基于Wasserstein分布式鲁棒优化的风险集成预测方法,步骤
S8中最佳集成策略表达为:
[0030][0031][0032]w

ι=1
[0033]其中,w表示集成策略,w

表示w的转置;表示随机变量的潜在分布,表示经验分布,e
t
第t期所有单体预测模型的预测值与实际值的差值,e

t
表示e
t
的转置;表示时间序列第N+1期所有单体预测模型的预测结果,y
N
为时间序列第N期的实际数值;σ2是一个外生变量,代表决策者能够接受的集成预测模型波动率;l是一个所有元素均为1的n维向量,即,l=[1,1,

,1]′

[0034]一些实施例公开的基于分布式鲁棒优化的风险集成预测方法,步骤S8中风险集成预测模型表达为:
[0035][0036]其中,表示第N+1期的预测结果,表示时间序列第N+1期所有单体预测模型的预测结果。
[0037]另一方面,一些实施例公开了基于Wasserstein分布式鲁棒优化的风险集成预测模型,该风险集成预测模型表达为:
[0038][0039]其中,表示第N+1期的预测结果,w表示集成策略,w...

【技术保护点】

【技术特征摘要】
1.基于Wasserstein分布式鲁棒优化的风险集成预测方法,其特征在于,包括步骤:S1、获取风险相关时序数据标的以及相应的外生变量数据;S2、选择单体预测模型,组成备选单体预测模型库;S3、将风险相关时序数据标的与外生变量数据转换为单体预测模型算法可读的数据结构;S4、将得到的数据结构划分为训练集和测试集;S5、利用训练集对单体预测模型分别进行训练;S6、基于训练好的单体预测模型,获取每个单体预测模型在测试集上的样本外预测输出和对应的预测误差;S7、利用各个单体预测模型在测试集上的预测误差数据,构造基于Wasserstein分布式鲁棒优化技术的模糊集;S8、确定最佳的集成策略,得到风险集成预测模型,对风险进行预测。2.根据权利要求1所述的基于Wasserstein分布式鲁棒优化的风险集成预测方法,其特征在于,所述单体预测模型包括指数平滑模型、自回归综合移动平均模型、支持向量机模型、相关向量机模型、前馈神经网络模型、广义回归神经网络模型、极限学习机模型、随机森林模型、长短期记忆模型。3.根据权利要求1所述的基于Wasserstein分布式鲁棒优化的风险集成预测方法,其特征在于,所述步骤S6包括:在测试集上,将不同时刻的风险相关时序数据输入到训练好的各个单体预测模型,得到每个单体预测模型的预测误差结果。4.根据权利要求3所述的基于Wasserstein分布式鲁棒优化的风险集成预测方法,其特征在于,所述步骤S7包括:所有的预测误差结果形成经验分布;基于经验分布,构建基于Wasserstein度量的模糊集。5.根据权利要求4所述的基于Wasserstein分布式鲁棒优化的风险集成预测方法,其特征在于,所述步骤S7进一步包括:基于Wasserstein度量的模糊集中的worst

case分布做优化,得到基于Wasserstein度量的分布式鲁棒优化模型。6.根据权利要求3所述的基于Wasserstein分布式鲁棒优化的风险集成预测方法,其特征在于,步骤S6中,每个单体预测模型的预测误差结果表达为单体预测模型的预测值与实际值的差值,表达为:其中,是一个n维向量,表示在第t期所有单体预测模型的预测结果,即是一个n维向量,表示在第t期所有单体预测模型的预测结果,即表示第t期集成预测模型的输出值;表示第i种单体预测模型在第t期的预测结果;n表示单体预测模型库中共有n种单体预测模型;y
t
为时间序列第t(t=1,2,

,N)期的实际数值;e
t

【专利技术属性】
技术研发人员:郝俊李建平袁佳鑫
申请(专利权)人:中国科学院大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1