一种基于模糊聚类算法改进LSTM的预测方法技术

技术编号:22330883 阅读:43 留言:0更新日期:2019-10-19 12:25
一种基于模糊聚类算法改进LSTM的预测方法,对标准化后的股票数据集进行模糊聚类,然后转化为时间序列,得到时间序列集S和模糊划分时间序列集T,从而得到融合模型,融合模型输出预测值;在得到预测值后,计算融合模型的总体误差,将融合模型的总体误差人工传递给各个LSTM网络输出层,之后LSTM网络自动的将部分误差反向传递至输入层,更新cell单元中的所有权重,得到已经训练好的融合模型;将时间序列集S中的测试集传入已经训练好的融合模型,输出最终预测值。本发明专利技术通过拟合现实中每个样本数据对于不同簇的不确定性,可有效降低LSTM网络的预测与真实值之间的误差,使得预测结果与实际情况更加接近且准确度提高。

【技术实现步骤摘要】
一种基于模糊聚类算法改进LSTM的预测方法
本专利技术涉及股票价格预测,特别涉及一种基于模糊聚类算法改进LSTM的预测方法。
技术介绍
股票价格预测是根据股票行情,包括股价历史交易信息以及股票相关的市场信息的发展对未来股票价格涨跌的预测行为。由于股票市场在商业和金融领域的重要意义,股票价格预测一直以来都吸引着广泛的关注。由于股票本身的波动性和不确定性,股票价格波动是一个高度复杂的非线性系统,其股票的调整不是按照均匀的时间过程推进,具有自身的推进过程,对于股票价格进行预测从而更好的进行选股和择时以获得最大收益也成为了诸多研究者密切关注的领域。当前较为常用的股票预测方法包括传统机器学习方法以及金融时间序列分析,如支持向量机、决策树、回归分析、ARMA模型等多种方法。这类算法可解释性强,但人工参数过多,过拟合和欠拟合等问题一直存在与此类算法之中,且此类算法由于其本身结构简单,往往一个模型只能针对单只股票建模,不能分析多支股票之间的相互关系,更不能分析市场中存在的消息面驱动因素带来的影响。近些年兴起的深度学习方法虽然在建模的可解释性上要弱于传统机器学习,但其本身模仿人脑神经元的结构使得它可以出色地完成各种复杂的分析任务,这当中就包含多股票的联合分析以及文本和股票信息的融合决策等。通过深度学习模型来预测股票走势其本身具有两大优势:一是模型中人工参数往往不直接影响预测效果,减少了人为因素对预测结果的影响;二是深度学习在泛化能力上通常要由于传统的机器学习,这些在一些比赛中已经得到了证实。已有成果对于深度学习在金融数据上的应用研究还较少,如何选择有效的策略针对市场中大量的股票数据中大量的股票进行分析并得到每只股票的预测结果以及保证精度控制风险有待进一步的研究。股票市场在目前的发展中,行业的类型比较明确,相关指标也得到了健全。在这样的基础之下,通过应用聚类分析算法,能够对股票市场中的行业走势和未来发展重点,进行比较准确的分析。聚类分析是一种有效的将数据合理归类的方法,它可以从大量数据中发现隐含在其中的数据结构。目前聚类算法对于数据的划分都是硬性的,硬划分的特点是把每个样本严格的划分到一个类中,然而真实的数据集合对于各个类具有不定性的隶属程度,因此需要一种聚类算法,更加符合真实数据的聚类情况,以实现股票价格的预测。
技术实现思路
本专利技术的目的在于解决股票市场中的价格预测问题,提供一种基于模糊聚类算法改进LSTM的预测方法,该预测方法引入模糊聚类算法,对已序列化的数据进行模糊聚类得到隶属度矩阵,并利用隶属度矩阵对经过融合的LSTM网络输出进行加权求和,最终得到股票价格预测值,可以有效的模拟股票趋势中的波动特点及场景,使得预测结果更加准确且符合实际。为了达到上述目的,本专利技术采用了以下技术方案:一种基于模糊聚类算法改进LSTM的预测方法,其特征在于,包括以下步骤:(一)将股票数据标准化,得到标准化股票数据集;(二)利用FCM算法对标准化后的股票数据集进行模糊聚类;(三)将模糊聚类后的股票数据集进行转化,得到时间序列集S和模糊划分时间序列集T;(四)根据时间序列集S和模糊划分时间序列集T,得到融合模型,融合模型输出预测值;(五)在每次得到预测值后根据目标函数,计算融合模型的总体误差,将融合模型的总体误差人工传递给各个LSTM网络输出层,然后LSTM网络自动的将部分误差反向传递至输入层,从而自动更新cell单元中的所有权重,得到已经训练好的融合模型;(六)将时间序列集S中的测试集传入步骤(五)中已经训练好的融合模型,输出最终预测值。本专利技术进一步的改进在于,步骤(一)的具体过程如下:1)求出股票数据集每个特征列的数学期望μk和标准差sk;2)进行标准化处理:zi=(xi-μk)/sk,其中:zi为标准化后的变量值,xi为实际变量值。本专利技术进一步的改进在于,步骤(二)的具体过程如下:1)用值在0,1之间的随机数初始化隶属度矩阵U,使其满足式(2.1)中的约束条件;式中,uij为第j个样本对应于第i个类别的隶属度;2)用式(2.3)计算c个聚类中心cj,j=1,2,...,c;其中,ci为第i个类别的聚类中心;xj为实际变量值;3)根据式(2.2)计算目标函数,如果目标函数值小于某个确定的阈值ε1,或它相对于上次目标函数值的改变量小于某个阈值ε2,则停止;否则进行步骤4);式中,dij=||ci-xi||为第i个聚类中心与第j个数据样本间的欧几里德距离;U为隶属度矩阵,c1为第一个类别的聚类中心,cc为第c个类别的聚类中心,m为一个隶属度因子;4)用式(2.4)计算新的隶属度矩阵U,并返回步骤2);其中,dkj为第k个聚类中心与第j个数据样本间的欧几里德距离。本专利技术进一步的改进在于,步骤(三)的具体过程如下:以时间步为5的时间间隔划分标准化股票数据集,假设如果当前时刻为t,则(xt,xt+1,xt+2,xt+3,xt+4)为一条以时刻t为起始时时刻的时间序列;以t+1时刻为起始时刻的时间序列为(xt+1,xt+2,xt+3,xt+4,xt+5),以此类推,将标准化股票数据集处理成以时间间隔为5的时间序列集S;将隶属度矩阵U同样以时间步为5的间隔进行划分,假设如果当前时刻为t,则(ut,ut+1,ut+2,ut+3,ut+4)为一条以时刻t为起始时时刻的时间序列;以t+1时刻为起始时刻的时间序列为(ut+1,ut+2,ut+3,ut+4,ut+5),以此类推,将隶属度矩阵U转化为以时间间隔为5的模糊划分时间序列集T。本专利技术进一步的改进在于,步骤(四)的具体过程为:将时间序列集S中的训练集输入至每个LSTM网络,经过cell单元的多层映射至输出层,使用模糊划分时间序列集T作为每个LSTM网络输出的权重,将权重与对应输出值加权作和,得到融合模型。本专利技术进一步的改进在于,步骤(四)中,假设模糊聚类有n个簇,第i样本的隶属度为(ui1,ui2,...,uin),n个LSTM网络,其输出为(ai1,ai2,...,ain),则融合模型的输出为:本专利技术进一步的改进在于,目标函数的公式为:其中m为样本数量,yi为样本真实值,为输出值。本专利技术进一步的改进在于,步骤(五)中,融合模型的总体误差为:式中,yi为样本真实值,为输出值,i=1,2,...,m;部分误差如下:式中,uik是样本xi隶属于类ck隶属度,i=1,2,...,m且k=1,2,...,n。与现有技术相比,本专利技术具有以下有益效果:本专利技术通过引入基于模糊聚类改进LSTM的预测方法,本专利技术使用FCM算法对数据进行模糊聚类,相比起把每个样本严格的划分到一个类中的“硬聚类”,模糊聚类分析将聚类生成的每个簇均看作模糊集合,通过隶属度来确定聚类关系,是一种柔性划分,得到样本属于各个类的不定性程度,使得聚类结果更加准确灵活,FCM算法引用模糊集合概念提高了模型预测的鲁棒性;本专利技术使用样本隶属度作为多个LSTM网络模型输出的权重,以此将多个LSTM模型融合得到最终的预测网络模型,模型融合集合多个模型,使得预测结果更加可信,加强了模型的预测效果。模糊聚类通过隶属函数来确定每个样本数据隶属于每个类的程度,而不是将一个数据对象硬性地归类到某一簇中。基于模糊聚类算法对LSTM(LongShort-TermMe本文档来自技高网
...

【技术保护点】
1.一种基于模糊聚类算法改进LSTM的预测方法,其特征在于,包括以下步骤:(一)将股票数据标准化,得到标准化股票数据集;(二)利用FCM算法对标准化后的股票数据集进行模糊聚类;(三)将模糊聚类后的股票数据集进行转化,得到时间序列集S和模糊划分时间序列集T;(四)根据时间序列集S和模糊划分时间序列集T,得到融合模型,融合模型输出预测值;(五)在每次得到预测值后根据目标函数,计算融合模型的总体误差,将融合模型的总体误差人工传递给各个LSTM网络输出层,然后LSTM网络自动的将部分误差反向传递至输入层,从而自动更新cell单元中的所有权重,得到已经训练好的融合模型;(六)将时间序列集S中的测试集传入步骤(五)中已经训练好的融合模型,输出最终预测值。

【技术特征摘要】
1.一种基于模糊聚类算法改进LSTM的预测方法,其特征在于,包括以下步骤:(一)将股票数据标准化,得到标准化股票数据集;(二)利用FCM算法对标准化后的股票数据集进行模糊聚类;(三)将模糊聚类后的股票数据集进行转化,得到时间序列集S和模糊划分时间序列集T;(四)根据时间序列集S和模糊划分时间序列集T,得到融合模型,融合模型输出预测值;(五)在每次得到预测值后根据目标函数,计算融合模型的总体误差,将融合模型的总体误差人工传递给各个LSTM网络输出层,然后LSTM网络自动的将部分误差反向传递至输入层,从而自动更新cell单元中的所有权重,得到已经训练好的融合模型;(六)将时间序列集S中的测试集传入步骤(五)中已经训练好的融合模型,输出最终预测值。2.根据权利要求1所述的一种基于模糊聚类算法改进LSTM的预测方法,其特征在于,步骤(一)的具体过程如下:1)求出股票数据集每个特征列的数学期望μk和标准差sk;2)进行标准化处理:zi=(xi-μk)/sk,其中:zi为标准化后的变量值,xi为实际变量值。3.根据权利要求1所述的一种基于模糊聚类算法改进LSTM的预测方法,其特征在于,步骤(二)的具体过程如下:1)用值在0,1之间的随机数初始化隶属度矩阵U,使其满足式(2.1)中的约束条件;式中,uij为第j个样本对应于第i个类别的隶属度;2)用式(2.3)计算c个聚类中心cj,j=1,2,...,c;其中,ci为第i个类别的聚类中心;xj为实际变量值;3)根据式(2.2)计算目标函数,如果目标函数值小于某个确定的阈值ε1,或它相对于上次目标函数值的改变量小于某个阈值ε2,则停止;否则进行步骤4);式中,dij=||ci-xi||为第i个聚类中心与第j个数据样本间的欧几里德距离;U为隶属度矩阵,c1为第一个类别的聚类中心,cc为第c个类别的聚类中心,m为一个隶属度因子;4)用式(2.4)计算新的隶属度矩阵U,并返回步骤2);其中,dkj为第k个聚类中心与第j个数据样本间的欧几...

【专利技术属性】
技术研发人员:曲桦赵季红李佳琪张艳鹏边江石亚娟
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1