一种基于模糊聚类算法改进LSTM的预测方法技术

技术编号：22330883 阅读：43 留言：0更新日期：2019-10-19 12:25

一种基于模糊聚类算法改进LSTM的预测方法，对标准化后的股票数据集进行模糊聚类，然后转化为时间序列，得到时间序列集S和模糊划分时间序列集T，从而得到融合模型，融合模型输出预测值；在得到预测值后，计算融合模型的总体误差，将融合模型的总体误差人工传递给各个LSTM网络输出层，之后LSTM网络自动的将部分误差反向传递至输入层，更新cell单元中的所有权重，得到已经训练好的融合模型；将时间序列集S中的测试集传入已经训练好的融合模型，输出最终预测值。本发明专利技术通过拟合现实中每个样本数据对于不同簇的不确定性，可有效降低LSTM网络的预测与真实值之间的误差，使得预测结果与实际情况更加接近且准确度提高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于模糊聚类算法改进LSTM的预测方法
本专利技术涉及股票价格预测，特别涉及一种基于模糊聚类算法改进LSTM的预测方法。
技术介绍
股票价格预测是根据股票行情，包括股价历史交易信息以及股票相关的市场信息的发展对未来股票价格涨跌的预测行为。由于股票市场在商业和金融领域的重要意义，股票价格预测一直以来都吸引着广泛的关注。由于股票本身的波动性和不确定性，股票价格波动是一个高度复杂的非线性系统，其股票的调整不是按照均匀的时间过程推进，具有自身的推进过程，对于股票价格进行预测从而更好的进行选股和择时以获得最大收益也成为了诸多研究者密切关注的领域。当前较为常用的股票预测方法包括传统机器学习方法以及金融时间序列分析，如支持向量机、决策树、回归分析、ARMA模型等多种方法。这类算法可解释性强，但人工参数过多，过拟合和欠拟合等问题一直存在与此类算法之中，且此类算法由于其本身结构简单，往往一个模型只能针对单只股票建模，不能分析多支股票之间的相互关系，更不能分析市场中存在的消息面驱动因素带来的影响。近些年兴起的深度学习方法虽然在建模的可解释性上要弱于传统机器学习，但其本身模仿人脑神经元的结构使得它可以出色地完成各种复杂的分析任务，这当中就包含多股票的联合分析以及文本和股票信息的融合决策等。通过深度学习模型来预测股票走势其本身具有两大优势：一是模型中人工参数往往不直接影响预测效果，减少了人为因素对预测结果的影响；二是深度学习在泛化能力上通常要由于传统的机器学习，这些在一些比赛中已经得到了证实。已有成果对于深度学习在金融数据上的应用研究还较少，如何选择有效的策略针对市场中大量的...

【技术保护点】
1.一种基于模糊聚类算法改进LSTM的预测方法，其特征在于，包括以下步骤：(一)将股票数据标准化，得到标准化股票数据集；(二)利用FCM算法对标准化后的股票数据集进行模糊聚类；(三)将模糊聚类后的股票数据集进行转化，得到时间序列集S和模糊划分时间序列集T；(四)根据时间序列集S和模糊划分时间序列集T，得到融合模型，融合模型输出预测值；(五)在每次得到预测值后根据目标函数，计算融合模型的总体误差，将融合模型的总体误差人工传递给各个LSTM网络输出层，然后LSTM网络自动的将部分误差反向传递至输入层，从而自动更新cell单元中的所有权重，得到已经训练好的融合模型；(六)将时间序列集S中的测试集传入步骤(五)中已经训练好的融合模型，输出最终预测值。

【技术特征摘要】
1.一种基于模糊聚类算法改进LSTM的预测方法，其特征在于，包括以下步骤：(一)将股票数据标准化，得到标准化股票数据集；(二)利用FCM算法对标准化后的股票数据集进行模糊聚类；(三)将模糊聚类后的股票数据集进行转化，得到时间序列集S和模糊划分时间序列集T；(四)根据时间序列集S和模糊划分时间序列集T，得到融合模型，融合模型输出预测值；(五)在每次得到预测值后根据目标函数，计算融合模型的总体误差，将融合模型的总体误差人工传递给各个LSTM网络输出层，然后LSTM网络自动的将部分误差反向传递至输入层，从而自动更新cell单元中的所有权重，得到已经训练好的融合模型；(六)将时间序列集S中的测试集传入步骤(五)中已经训练好的融合模型，输出最终预测值。2.根据权利要求1所述的一种基于模糊聚类算法改进LSTM的预测方法，其特征在于，步骤(一)的具体过程如下：1)求出股票数据集每个特征列的数学期望μk和标准差sk；2)进行标准化处理：zi＝(xi-μk)/sk，其中：zi为标准化后的变量值，xi为实际变量值。3.根据权利要求1所述的一种基于模糊聚类算法改进LSTM的预测方法，其特征在于，步骤(二)的具体过程如下：1)用值在0，1之间的随机数初始化隶属度矩阵U，使其满足式(2.1)中的约束条件；式中，uij为第j个样本对应于第i个类别的隶属度；2)用式(2.3)计算c个聚类中心cj，j＝1,2,...,c；其中，ci为第i个类别的聚类中心；xj为实际变量值；3)根据式(2.2)计算目标函数，如果目标函数值小于某个确定的阈值ε1，或它相对于上次目标函数值的改变量小于某个阈值ε2，则停止；否则进行步骤4)；式中，dij＝||ci-xi||为第i个聚类中心与第j个数据样本间的欧几里德距离；U为隶属度矩阵，c1为第一个类别的聚类中心，cc为第c个类别的聚类中心，m为一个隶属度因子；4)用式(2.4)计算新的隶属度矩阵U，并返回步骤2)；其中，dkj为第k个聚类中心与第j个数据样本间的欧几...

【专利技术属性】
技术研发人员：曲桦，赵季红，李佳琪，张艳鹏，边江，石亚娟，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人