一种基于MPSO-LSTM模型的股票预测方法及系统技术方案

技术编号:29587560 阅读:15 留言:0更新日期:2021-08-06 19:47
本发明专利技术涉及一种基于MPSO‑LSTM模型的股票预测方法及系统,属于深度学习和模式识别技术领域。该方法首先通过对股票原始数据进行数据归一化处理得到预处理数据,从而使得最优解的寻优过程变得平缓,更容易正确的收敛得到最优解。通过改进的粒子群算法MPSO对LSTM模型进行超参数寻优的方法,避免了依赖经验和反复实验的带来的不稳定性和低效性。同时基于改进的粒子群算法MPSO可进一步提升粒子寻优质量,最终依此构建的MPSO‑LSTM模型对指定的数据集所表现出来的数据特征具有一定的适应性,从而充分发挥LSTM模型处理时间序列的性能优势。

【技术实现步骤摘要】
一种基于MPSO-LSTM模型的股票预测方法及系统
本专利技术涉及深度学习和模式识别
,具体涉及一种基于MPSO-LSTM模型的股票预测方法及系统。
技术介绍
众所周知,股票投资者通过交易前后的价格差来获取收益。股票预测的研究可以帮助股民降低投资风险。因此,股票预测一直以来都是一个热门的研究领域。股票预测的方法主要有基本面分析法和技术分析法。基本面分析法需要对企业的经营状况、整体经济形势、政策法规等因素进行综合考虑,进而对股票的价值进行评估。技术分析法则是立足于证券市场本身,通过诸多技术指标研究股市过去和现在所反映出来的特征和规律,以达到预测未来价格的目的。但是,前者对投资者的理论知识和社会经验有很高的要求,而且获取有效信息的成本较高。因此,本专利技术选择使用更加广泛的后者。目前国内外的技术分析法包含的方法庞杂多样,预测效果相差很大。ARIMA是其中使用较多的模型之一,它在处理平稳的时序数据时有较好的性能表现。但是股票数据具有严重的非平稳性,所以该模型并不适合这个任务。此外,前馈神经网络、模糊神经模型、SVM等方法由于缺乏对时序数据时间相关性的学习能力,同样不满足预测的精度要求。近来崛起的深度神经网络模型,在处理非线性映射和学习复杂特征方面具有显著优势。LSTM是目前处理时间序列使用最多的神经网络之一。与其他神经网络模型类似,LSTM神经网络模型中部分参数如时间窗大小、批处理数量、隐藏层单元数目等依赖于经验值和多次实验反复验证结果,效率低下。而且依靠经验设定的结果具有较大的不稳定性,降低了模型的预测效果。因此,最近出现了使用PSO-LSTM组合模型,利用粒子群算法优化LSTM网络的超参数的研究方法。但是这种方法基于标准粒子群的寻优过程并没有考虑粒子群自身的权重对全局最优解的影响,优化LSTM网络的性能和效率的有待进一步提升。
技术实现思路
本专利技术是为了解决上述问题而进行的,目的在于提供一种基于MPSO-LSTM模型的股票预测方法及系统。本专利技术提供了一种基于MPSO-LSTM模型的股票预测方法,具有这样的特征,包括如下步骤:步骤1,对原始股票数据进行数据归一化预处理,得到预处理数据;步骤2,将预处理数据划分为训练集、验证集及测试集;步骤3,基于训练集与验证集,使用MPSO算法对LSTM模型的三个超参数进行全局寻优,得到最优粒子;步骤4,根据最优粒子构建MPSO-LSTM模型;以及步骤5,根据MPSO-LSTM模型对测试集进行预测,得到预测结果,其中,步骤3中,三个超参数为时间窗大小、批处理数量及隐藏层单元数目。在本专利技术提供的基于MPSO-LSTM模型的股票预测方法中,还具有这样的特征:其中,步骤1中,将预处理数据的前70%作为训练集,将预处理数据的其次20%作为验证集,将预处理数据的最后10%作为测试集。在本专利技术提供的基于MPSO-LSTM模型的股票预测方法中,还具有这样的特征:其中,步骤2中,数据归一化的计算公式如下:式(1)中,xR为归一化后的值;x为股票数据原始值;xmax和xmin分别代表相应指标的最大值和和最小值。在本专利技术提供的基于MPSO-LSTM模型的股票预测方法中,还具有这样的特征:其中,步骤3中,三个超参数的优化过程过下:用一个D维的向量表示第i个粒子,第i个粒子的位置为:Xi=(xi1,xi1,...,xiD),第i个粒子的最佳先前位置为:Pi=(pi1,pi1,...,piD),第i个粒子的速度为:Vi=(vi1,vi1,...,viD),第i个粒子的位置和第i个粒子的速度按照以下公式更新:式(2)-(3)中,表示第i个粒子经过t+1次迭代后的速度,为t+1次迭代后第i个粒子的位置,c1为第一学习因子,rand1为第一随机数,为第t时刻粒子i本身最优位置的第d维变量,c2为第二学习因子,rand2为第二随机数,为第t时刻粒子种群最优位置的第d维变量,为在第t时刻粒子第d维变量的位置,ω为惯性因子,其取值为非负数,对ω的更新按以下公式进行,式(4)中t表示当前迭代次数,tmax为最大迭代次数,ωmax和ωmin分别表示ω的最大值和最小值。在本专利技术提供的基于MPSO-LSTM模型的股票预测方法中,还具有这样的特征:其中,步骤3包括如下子步骤:步骤3-1,将LSTM模型中的时间窗大小、批处理数量、隐藏层单元数目作为优化对象,随机生成一组待优化参数作为粒子初始化向量;步骤3-2,将预测结果的平均绝对百分比误差作为适应度值,适应度值fiti的计算公式如下:式(5)中,M表示验证数据集的样本数,yi为验证样本的实际值,为验证样本的预测值;步骤3-2,规定Pbest为粒子当前最优位置,Gbest为种群的最优位置,并对Gbest和Pbest进行初始化;步骤3-4,根据公式(2)和公式(3),对粒子的速度和位置进行更新;步骤3-5,计算每个粒子的适应度值,将每个粒子的适应度值与Pbest进行比较,并保留更好的Pbest,计算种群的适合度值,并与Gbest进行比较,并保留更好的Gbest;以及步骤3-6,重复执行步骤3-4和步骤3-5,当损失值达到阈值要求时,跳出循环,得到最优粒子。本专利技术提供了一种基于MPSO-LSTM模型的股票预测系统,具有这样的特征,包括:数据预处理部、数据划分部、最优粒子获取部、MPSO-LSTM模型构建部、结果预测部以及控制部,数据预处理部,对原始股票数据进行数据归一化预处理,得到预处理数据;数据划分部,将预处理数据划分为训练集、验证集及测试集;最优粒子获取部,基于训练集与验证集,使用MPSO算法对LSTM模型的三个超参数进行全局寻优,得到最优粒子;MPSO-LSTM模型构建部,根据最优粒子构建MPSO-LSTM模型;结果预测部,根据MPSO-LSTM模型对测试集进行预测,得到预测结果;以及控制部,控制数据预处理部、数据划分部、最优粒子获取部、MPSO-LSTM模型构建部、结果预测部运行,其中,三个超参数为时间窗大小、批处理数量及隐藏层单元数目。专利技术的作用与效果根据本专利技术所涉及的基于MPSO-LSTM模型的股票预测方法,首先通过对股票原始数据进行数据归一化处理得到预处理数据,从而使得最优解的寻优过程变得平缓,更容易正确的收敛得到最优解。通过改进的粒子群算法MPSO对LSTM模型进行超参数寻优的方法,避免了依赖经验和反复实验的带来的不稳定性和低效性。同时基于改进的粒子群算法MPSO可进一步提升粒子寻优质量,最终依此构建的MPSO-LSTM模型对指定的数据集所表现出来的数据特征具有一定的适应性,从而充分发挥LSTM模型处理时间序列的性能优势。附图说明图1是本专利技术的实施例中基于MPSO-LSTM模型的股票预测方法的流程图;图2是本专利技术的实施例中基于MPSO-LSTM模型的股票预测方法中步骤3的子步骤流程图;图3是本专利技术的实施例中长短期记忆神经网络(LSTM)的结构图;本文档来自技高网
...

【技术保护点】
1.一种基于MPSO-LSTM模型的股票预测方法,其特征在于,包括如下步骤:/n步骤1,对原始股票数据进行数据归一化预处理,得到预处理数据;/n步骤2,将所述预处理数据划分为训练集、验证集及测试集;/n步骤3,基于所述训练集与所述验证集,使用MPSO算法对LSTM模型的三个超参数进行全局寻优,得到最优粒子;/n步骤4,根据所述最优粒子构建MPSO-LSTM模型;以及/n步骤5,根据所述MPSO-LSTM模型对所述测试集进行预测,得到预测结果,/n其中,步骤3中,所述三个超参数为时间窗大小、批处理数量及隐藏层单元数目。/n

【技术特征摘要】
1.一种基于MPSO-LSTM模型的股票预测方法,其特征在于,包括如下步骤:
步骤1,对原始股票数据进行数据归一化预处理,得到预处理数据;
步骤2,将所述预处理数据划分为训练集、验证集及测试集;
步骤3,基于所述训练集与所述验证集,使用MPSO算法对LSTM模型的三个超参数进行全局寻优,得到最优粒子;
步骤4,根据所述最优粒子构建MPSO-LSTM模型;以及
步骤5,根据所述MPSO-LSTM模型对所述测试集进行预测,得到预测结果,
其中,步骤3中,所述三个超参数为时间窗大小、批处理数量及隐藏层单元数目。


2.根据权利要求1所述的基于MPSO-LSTM模型的股票预测方法,其特征在于:
其中,步骤1中,将所述预处理数据的前70%作为所述训练集,将所述预处理数据的其次20%作为所述验证集,将所述预处理数据的最后10%作为所述测试集。


3.根据权利要求1所述的基于MPSO-LSTM模型的股票预测方法,其特征在于:
其中,步骤2中,所述数据归一化的计算公式如下:



式(1)中,xR为归一化后的值;x为股票数据原始值;xmax和xmin分别代表相应指标的最大值和和最小值。


4.根据权利要求1所述的基于MPSO-LSTM模型的股票预测方法,其特征在于:
其中,步骤3中,所述三个超参数的优化过程过下:
用一个D维的向量表示第i个粒子,
所述第i个粒子的位置为:Xi=(xi1,xi1,...,xiD),
所述第i个粒子的最佳先前位置为:Pi=(pi1,pi1,...,PiD),
所述第i个粒子的速度为:Vi=(vi1,vi1,...,viD),
所述第i个粒子的位置和所述第i个粒子的速度按照以下公式更新:






式(2)-(3)中,表示第i个粒子经过t+1次迭代后的速度,为t+1次迭代后第i个粒子的位置,c1为第一学习因子,rand1为第一随机数,为第t时刻粒子i本身最优位置的第d维变量,c2为第二学习因子,rand2为第二随机数,为第t时刻粒子种群最优位置的第d维变量,为在第t时刻粒子第d维变量的位置,ω为惯性因子,其取值为非负数,
对...

【专利技术属性】
技术研发人员:陈志全唐小岚
申请(专利权)人:上海电力大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1