基于Wasserstein分布式鲁棒优化的风险集成预测方法技术

技术编号：38137465 阅读：10 留言：0更新日期：2023-07-08 09:49

本发明专利技术实施例公开了基于Wasserstein分布式鲁棒优化的风险集成预测方法；预测方法包括步骤：S1、获取风险相关时序数据标的以及相应的外生变量数据；S2、选择单体预测模型，组成备选单体预测模型库；S3、将风险相关时序数据标的与外生变量数据转换为单体预测模型算法可读的数据结构；S4、将得到的数据结构划分为训练集和测试集；S5、利用训练集对单体预测模型分别进行训练；S6、基于训练好的单体预测模型，获取每个单体预测模型在测试集上的样本外预测输出和对应的预测误差；S7、利用各个单体预测模型在测试集上的预测误差数据，构造基于Wasserstein分布式鲁棒优化技术的模糊集；S8、确定最佳的集成策略，得到风险集成预测模型，对风险进行预测。对风险进行预测。对风险进行预测。

全部详细技术资料下载

【技术实现步骤摘要】
基于Wasserstein分布式鲁棒优化的风险集成预测方法

[0001]本专利技术属于数据处理
，特别属于时序数据处理
，具体涉及基于Wasserstein分布式鲁棒优化的风险集成预测方法。

技术介绍

[0002]为了准确地对风险进行预测，已有研究开发和使用了大量的计量经济学模型和机器学习模型。但是大量文献的实证研究结果表明，任何一个单预测模型可能不足以识别风险相关时序数据的所有特征，特别是对具有高度复杂性和不确定性的风险相关时序数据，很难找到一个预测模型能够挖掘出这一类复杂数据背后的客观规律。而集成预测模型，即将多个方法、模型以一定的搭配组合形式融合为一个预测模型能够充分利用各个方法与模型各自的优点，互相补充，利用每个模型方法的独特特性，进而通过集成的思想以获得新的有价值信息，最终提高预测模型的预测精度和稳定性，达到明显改善预测效果的目的。
[0003]集成策略可以分为线性或非线性、等权或非等权等，常用的集成策略主要有简单平均和加权平均。在异质集成预测中，简单平均和非线性策略被经常用来进行模型结果的集成，例如可以利用多目标粒子群算法实现航运指数的非线性集成预测；可以利用分解技术与预测方法相结合的半异构方法进行原油价格预测。在同质集成预测中，简单平均集成策略最受欢迎，其主要原因在于简单平均策略不需要进行额外的参数估计，对估计误差不敏感；例如可以利用简单平均策略分别对风险相关的市场收益率和汇率走势进行预测研究。
[0004]近年来，研究人员在集成预测的集成策略构造和单体预测模型选择上已取得长

【技术保护点】

【技术特征摘要】
1.基于Wasserstein分布式鲁棒优化的风险集成预测方法，其特征在于，包括步骤：S1、获取风险相关时序数据标的以及相应的外生变量数据；S2、选择单体预测模型，组成备选单体预测模型库；S3、将风险相关时序数据标的与外生变量数据转换为单体预测模型算法可读的数据结构；S4、将得到的数据结构划分为训练集和测试集；S5、利用训练集对单体预测模型分别进行训练；S6、基于训练好的单体预测模型，获取每个单体预测模型在测试集上的样本外预测输出和对应的预测误差；S7、利用各个单体预测模型在测试集上的预测误差数据，构造基于Wasserstein分布式鲁棒优化技术的模糊集；S8、确定最佳的集成策略，得到风险集成预测模型，对风险进行预测。2.根据权利要求1所述的基于Wasserstein分布式鲁棒优化的风险集成预测方法，其特征在于，所述单体预测模型包括指数平滑模型、自回归综合移动平均模型、支持向量机模型、相关向量机模型、前馈神经网络模型、广义回归神经网络模型、极限学习机模型、随机森林模型、长短期记忆模型。3.根据权利要求1所述的基于Wasserstein分布式鲁棒优化的风险集成预测方法，其特征在于，所述步骤S6包括：在测试集上，将不同时刻的风险相关时序数据输入到训练好的各个单体预测模型，得到每个单体预测模型的预测误差结果。4.根据权利要求3所述的基于Wasserstein分布式鲁棒优化的风险集成预测方法，其特征在于，所述步骤S7包括：所有的预测误差结果形成经验分布；基于经验分布，构建基于Wasserstein度量的模糊集。5.根据权利要求4所述的基于Wasserstein分布式鲁棒优化的风险集成预测方法，其特征在于，所述步骤S7进一步包括：基于Wasserstein度量的模糊集中的worst
‑
case分布做优化，得到基于Wasserstein度量的分布式鲁棒优化模型。6.根据权利要求3所述的基于Wasserstein分布式鲁棒优化的风险集成预测方法，其特征在于，步骤S6中，每个单体预测模型的预测误差结果表达为单体预测模型的预测值与实际值的差值，表达为：其中，是一个n维向量，表示在第t期所有单体预测模型的预测结果，即是一个n维向量，表示在第t期所有单体预测模型的预测结果，即表示第t期集成预测模型的输出值；表示第i种单体预测模型在第t期的预测结果；n表示单体预测模型库中共有n种单体预测模型；y
t
为时间序列第t(t＝1,2,
…
,N)期的实际数值；e
t

【专利技术属性】
技术研发人员：郝俊，李建平，袁佳鑫，
申请(专利权)人：中国科学院大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人