基于变分模态分解和单循环单元的股价序列预测方法技术

技术编号:33859756 阅读:13 留言:0更新日期:2022-06-18 10:49
本发明专利技术涉及金融信息数据处理技术领域,尤其涉及一种基于变分模态分解和单循环单元的股价序列预测方法,包括以下步骤:切割,使用滑动窗口把整个股价序列切割为多个子段;去噪,使用VMD对所有子段序列进行分解,去除噪声分量后重构时间序列;聚类,使用DMPSM计算任意两个子段序列之间的个性化相似性,根据其大小将去噪后的序列分为多类;预测,针对每一类中的子段序列训练一个最优的SRU模型,判断待测序列所属类别后使用所述SRU模型进行预测。本发明专利技术的有益效果:提高了预测结果的准确度和预测速度,参数自适应确定方法提高了分解准确性和减少了计算负担,个性化相似性测度解决了时间漂移和错位现象,反映了时间序列的个性化特征。征。征。

【技术实现步骤摘要】
基于变分模态分解和单循环单元的股价序列预测方法


[0001]本专利技术涉及金融信息数据处理
,尤其涉及一种基于变分模态分解和单循环单元的股价序列预测方法。

技术介绍

[0002]作为最流行的财务管理方式之一,股票吸引了越来越多的机构和个人投资者。对股票价格的精确预测不仅可以降低投资决策的风险,而且可以有效地促进金融市场的稳定和经济的健康发展。然而,由于股票市场受到汇率、通货膨胀率、经济政策、政治紧急情况等多种因素的影响,股票价格具有高度的噪声性、非线性和非平稳性,且各个股票的波动趋势大不相同,股价序列内部关系也较为复杂。因此,股票价格的预测对于研究者和投机者们来说始终是一项具有挑战性的任务。
[0003]现有股价序列预测方法主要分为三类:(1)统计方法。股票价格随时间的变化本质上是时间序列,统计学中最常用的时间序列预测方法包括差分自回归移动平均模型(AutoRegressive Integrated Moving Average,ARIMA),自回归条件异方差模型(AutoRegressive Conditional Heteroskedasticity,ARCH),广义自回归条件异方差模型(Generalized AutoRegressive Conditional Heteroskedasticity,GARCH)等。然而,这些统计方法仍然不能完全捕捉股价数据的复杂性,并且股票数据的非线性、非平稳甚至季节性波动也导致这些方法的基本假设很少得到满足。(2)机器学习方法。近几十年来,随着人工智能技术的快速发展,大量机器学习方法被用于金融时间序列分析,例如,支持向量机(Support Vector Machine,SVM),支持向量回归(Support Vector Regression,SVR),决策树回归(Decision Tree Regression,DTR)等。尽管上述机器学习方法有着悠久的历史并发挥了一定的作用,但它们仍然不足以处理海量数据和更复杂的映射关系。(3)深度学习方法。得益于大数据的出现和计算机技术的进步,深度学习在许多领域都取得了巨大的成就,为了获得更准确的预测结果,研究人员已逐渐将其应用于股市。现如今在股价序列预测上较为常用的深度学习方法有循环神经网络(Recurrent Neural Network,RNN),长短期记忆网络(Long Short Term Memory,LSTM),门控循环单元(Gate Recurrent Unit,GRU)等。还有在深度学习模型的基础上叠加其他方法集合为一个混合模型的方式,例如LSTM和卷积神经网络(Convolutional Neural Network,CNN)相结合,经验模态分解(Empirical Mode Decomposition,EMD)和LSTM相结合等。深度学习方法具有很强的处理大数据和学习属性之间非线性关系的能力,在许多股市预测研究中被证明其优秀性。
[0004]现有的股价序列预测方法在技术上存在以下三个缺点:(1)高噪声的股价序列数据没有进行有效的降噪处理;(2)对于波动趋势不同的股价序列,只训练一个预测模型显然是不合理的,会导致该模型的预测结果不准确;(3)对于内部映射关系复杂的股价序列,其预测模型本身的运行速度和预测精度值得进一步提高。

技术实现思路

[0005]克服现有技术中存在的不足,提供一种基于变分模态分解和单循环单元的股价序列预测方法,包括以下步骤:
[0006]步骤S1、切割,使用滑动窗口把整个股价序列切割为多个子段;
[0007]步骤S2、去噪,使用变分模态分解(Variational Mode Decomposition,VMD)对所有所述子段序列进行分解,去除噪声分量后重构时间序列;
[0008]步骤S3、聚类,使用动态多视角个性化相似性测度(Dynamic Multi

perspective Personalized Similarity Measurement,DMPSM)计算任意两个子段序列之间的个性化相似性,根据相似性值的大小将去噪后的序列分为多类;
[0009]步骤S4、预测,针对每一类中的子段序列训练一个最优的单循环单元(Simple Recurrent Unit,SRU)模型,在预测时判断待测序列所属类别后直接使用该类训练出的SRU模型进行预测。
[0010]进一步地,所述步骤S2中,VMD中分解个数的确定方法为:
[0011]计算不同分解个数下每个分解模态的样本熵,得到不同情况下的噪声分量和保留分量;
[0012]计算每种分解情况下保留分量的平均样本熵,以及噪声分量和保留分量的互相关;
[0013]依据平均样本熵和互相关的值确定最佳分解个数。
[0014]进一步地,所述步骤S2中,所述样本熵的计算如下:
[0015]假设一时间序列y有N个数据,即y=[y1,y2,...,y
N
],预设VMD将其分解为K个模态,第k个模态为u
k
=[u
k1
,u
k2
,...,u
kN
],将u
k
中的N个数据点按顺序组成m维向量得到U(i)=[u
k
(i),u
k
(i+1),...,u
k
(i+m

1)],i=1,2,...,N

m+1,两个这样的向量之间对应元素相差最大的距离为d
m
[U(i),U(j)]=max
l=0,1,...,m
‑1|u
k
(i+l)

u
k
(j+l)|,j=1,2,...,N

m且i≠j。
[0016]记B
i
为d
m
[U(i),U(j)]<r的个数,r为相似度度量容限,构建对其取平均为增加维数到m+1,B
m
(r)为两个序列在相似度度量容限r下匹配m个点的概率,B
m+1
(r)为两个序列在相似度度量容限r下匹配m+1个点的概率。
[0017]定义模态分量序列的样本熵为当N取值有限时,得到样本熵的估计值为
[0018][0019]进一步地,所述步骤S2中,所述互相关的计算如下:
[0020][0021]g(t)和c(t)为两个序列。将R
cg
(τ)标准化为
[0022]R
gg
(0)和R
cc
(0)分别为两个序列在同一时刻的自相关函数,序列v(t)的自相关函数为
[0023]进一步地,所述步骤S2中,当平均样本熵和互相关的值达到最小时,相应的分解个数即为最佳。
[0024]进一步地,所述步骤S3中,DMPSM的计算如下:X=(x1,x2,...,x
n
)和Y=(y1,y本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于变分模态分解和单循环单元的股价序列预测方法,其特征在于:包括以下步骤:步骤S1、切割,使用滑动窗口把整个股价序列切割为多个子段序列;步骤S2、去噪,使用VMD对所有所述子段序列进行分解,去除噪声分量后重构时间序列;步骤S3、聚类,使用DMPSM计算任意两个所述子段序列之间的个性化相似性,根据相似性值的大小将去噪后的所述子段序列分为多类;步骤S4、预测,针对每一类中的所述子段序列训练一个最优的SRU模型,在预测时判断待测所述子段序列所属类别,直接使用该类训练出的所述SRU模型进行预测。2.根据权利要求1所述的基于变分模态分解和单循环单元的股价序列预测方法,其特征在于:所述步骤S2中,VMD中分解个数的确定方法为:计算不同分解个数下每个分解模态的样本熵,得到不同情况下的噪声分量和保留分量;计算每种分解情况下保留分量的平均样本熵,以及噪声分量和保留分量的互相关;依据所述平均样本熵和所述互相关的值确定最佳分解个数。3.根据权利要求2所述的基于变分模态分解和单循环单元的股价序列预测方法,其特征在于:所述步骤S2中,所述样本熵的计算如下:假设一时间序列y有N个数据,即y=[y1,y2,...,y
N
],预设VMD将其分解为K个模态,第K个模态为u
k
=[u
k1
,u
k2
,...,u
kN
],将u
k
中的N个数据点按顺序组成m维向量得到U(i)=[u
k
(i),u
k
(i+1),...,u
k
(i+m

1)],i=1,2,...,N

m+1,两个所述向量之间对应元素相差最大的距离为d
m
[U(i),U(j)]=max
l=0,1,...,m
‑1|u
k
(i+l)

u
k
(j+l)|,j=1,2,...,N

m且i≠j。记B
i
为d
m
[U(i),U(j)]<r的个数,r为相似度度量容限,构建对其取平均为增加维数到m+1,B
m
(r)为两个序列在相似度度量容限r下匹配m个点的概率,B
m+1
(r)为两个序列在相似度度量容限r下匹配m+1个点的概率,定义模态分量序列的样本熵为当N取值有限时,得到样本熵的估计值为4.根据权利要求2所述的基于变分模态分解和单循环单元的股价序列预测方法,其特征在于:所述步骤S2中,所述互相关的计算如下:g(t)和c(t)为两个序列,将R
cg
(τ)标准化为R
gg
(0)和R
cc
(0)分别为两个序列在同一时刻的自相关函数,序列v(t)的自相关函数为5.根据权利要求2~4任一项所述的基于变分模态分解和单循环单元的股价序列预测
方法,其特征在于:所述步骤S2中,当所述平均样本熵和所述互相关的值达到最小时,相应的分解个数即为最佳。6.根据权利要求1所述的基于变分模态分解和单循环单元的股价序列预测方法,其特征在于:所述步骤S3中,DMPSM的计算如下:X=(x...

【专利技术属性】
技术研发人员:王庆祝赵峰陆燕刘培强
申请(专利权)人:山东工商学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1