一种基于MPSO-LSTM模型的股票预测方法及系统技术方案

技术编号：29587560 阅读：15 留言：0更新日期：2021-08-06 19:47

本发明专利技术涉及一种基于MPSO‑LSTM模型的股票预测方法及系统，属于深度学习和模式识别技术领域。该方法首先通过对股票原始数据进行数据归一化处理得到预处理数据，从而使得最优解的寻优过程变得平缓，更容易正确的收敛得到最优解。通过改进的粒子群算法MPSO对LSTM模型进行超参数寻优的方法，避免了依赖经验和反复实验的带来的不稳定性和低效性。同时基于改进的粒子群算法MPSO可进一步提升粒子寻优质量，最终依此构建的MPSO‑LSTM模型对指定的数据集所表现出来的数据特征具有一定的适应性，从而充分发挥LSTM模型处理时间序列的性能优势。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于MPSO-LSTM模型的股票预测方法及系统
本专利技术涉及深度学习和模式识别
，具体涉及一种基于MPSO-LSTM模型的股票预测方法及系统。
技术介绍
众所周知，股票投资者通过交易前后的价格差来获取收益。股票预测的研究可以帮助股民降低投资风险。因此，股票预测一直以来都是一个热门的研究领域。股票预测的方法主要有基本面分析法和技术分析法。基本面分析法需要对企业的经营状况、整体经济形势、政策法规等因素进行综合考虑，进而对股票的价值进行评估。技术分析法则是立足于证券市场本身，通过诸多技术指标研究股市过去和现在所反映出来的特征和规律，以达到预测未来价格的目的。但是，前者对投资者的理论知识和社会经验有很高的要求，而且获取有效信息的成本较高。因此，本专利技术选择使用更加广泛的后者。目前国内外的技术分析法包含的方法庞杂多样,预测效果相差很大。ARIMA是其中使用较多的模型之一，它在处理平稳的时序数据时有较好的性能表现。但是股票数据具有严重的非平稳性，所以该模型并不适合这个任务。此外，前馈神经网络、模糊神经模型、SVM等方法由于缺乏对时序数据时间相关性的学习能力，同样不满足预测的精度要求。近来崛起的深度神经网络模型，在处理非线性映射和学习复杂特征方面具有显著优势。LSTM是目前处理时间序列使用最多的神经网络之一。与其他神经网络模型类似，LSTM神经网络模型中部分参数如时间窗大小、批处理数量、隐藏层单元数目等依赖于经验值和多次实验反复验证结果，效率低下。而且依靠经验设定的结果具有较大的不稳定性，降低了模型的...

【技术保护点】
1.一种基于MPSO-LSTM模型的股票预测方法，其特征在于，包括如下步骤：/n步骤1，对原始股票数据进行数据归一化预处理，得到预处理数据；/n步骤2，将所述预处理数据划分为训练集、验证集及测试集；/n步骤3，基于所述训练集与所述验证集，使用MPSO算法对LSTM模型的三个超参数进行全局寻优，得到最优粒子；/n步骤4，根据所述最优粒子构建MPSO-LSTM模型；以及/n步骤5，根据所述MPSO-LSTM模型对所述测试集进行预测，得到预测结果，/n其中，步骤3中，所述三个超参数为时间窗大小、批处理数量及隐藏层单元数目。/n

【技术特征摘要】
1.一种基于MPSO-LSTM模型的股票预测方法，其特征在于，包括如下步骤：
步骤1，对原始股票数据进行数据归一化预处理，得到预处理数据；
步骤2，将所述预处理数据划分为训练集、验证集及测试集；
步骤3，基于所述训练集与所述验证集，使用MPSO算法对LSTM模型的三个超参数进行全局寻优，得到最优粒子；
步骤4，根据所述最优粒子构建MPSO-LSTM模型；以及
步骤5，根据所述MPSO-LSTM模型对所述测试集进行预测，得到预测结果，
其中，步骤3中，所述三个超参数为时间窗大小、批处理数量及隐藏层单元数目。

2.根据权利要求1所述的基于MPSO-LSTM模型的股票预测方法，其特征在于：
其中，步骤1中，将所述预处理数据的前70％作为所述训练集，将所述预处理数据的其次20％作为所述验证集，将所述预处理数据的最后10％作为所述测试集。

3.根据权利要求1所述的基于MPSO-LSTM模型的股票预测方法，其特征在于：
其中，步骤2中，所述数据归一化的计算公式如下：

式(1)中，xR为归一化后的值；x为股票数据原始值；xmax和xmin分别代表相应指标的最大值和和最小值。

4.根据权利要求1所述的基于MPSO-LSTM模型的股票预测方法，其特征在于：
其中，步骤3中，所述三个超参数的优化过程过下：
用一个D维的向量表示第i个粒子，
所述第i个粒子的位置为：Xi＝(xi1，xi1，...，xiD)，
所述第i个粒子的最佳先前位置为：Pi＝(pi1，pi1，...，PiD)，
所述第i个粒子的速度为：Vi＝(vi1，vi1，...，viD)，
所述第i个粒子的位置和所述第i个粒子的速度按照以下公式更新：

式(2)-(3)中，表示第i个粒子经过t+1次迭代后的速度，为t+1次迭代后第i个粒子的位置，c1为第一学习因子，rand1为第一随机数，为第t时刻粒子i本身最优位置的第d维变量，c2为第二学习因子，rand2为第二随机数，为第t时刻粒子种群最优位置的第d维变量，为在第t时刻粒子第d维变量的位置，ω为惯性因子，其取值为非负数，
对...

【专利技术属性】
技术研发人员：陈志全，唐小岚，
申请(专利权)人：上海电力大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人