一种基于长短记忆网络与深度数据清洗的金融时间序列预测方法，装置及服务器制造方法及图纸

技术编号：22308979 阅读：57 留言：0更新日期：2019-10-16 09:02

本发明专利技术属于金融时间序列数据处理领域，公开了一种基于长短记忆网络与深度数据清洗的金融时间序列预测方法、装置和服务器，方法包括：截取股票金融时间序列数据，进行经验模态分解后获得本征模态函数序列；采用降维处理对本征模态函数序列中的冗余数据进行压缩；采用堆叠自动编码器对降维得到的数据进行无监督学习，获得金融时间序列的深层特征；将金融时间序列的深层特征按照比例分为训练集、验证集和测试集，并采用训练集对时间循环神经网络模型进行训练后获得训练好的时间循环神经网络模型；根据训练好的时间循环神经网络模型对金融时间序列进行预测。本发明专利技术通过将堆叠自动编码器和长短期记忆网络结合并应用于股票价格预测来提高金融预测的速度和准确性。

A prediction method, device and server of financial time series based on long short memory network and deep data cleaning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于长短记忆网络与深度数据清洗的金融时间序列预测方法，装置及服务器
本专利技术属于金融时间序列数据处理领域，更具体地，涉及一种基于长短记忆网络与深度数据清洗的金融时间序列预测方法。
技术介绍
在全球经济、金融一体化的今天，金融市场不断呈现出很多经典金融理论无力解释的复杂现象，主要表现为：金融市场不再是有效市场假说描述下的理想市场，金融市场呈现出的高智能性、强相关性、紧耦合性使它成为一个复杂的非线性动力系统。构建预测模型对这样一个复杂的非线性动力系统进行描述，揭示金融时间序列运行的内在规律，并在世人面前展示它的演化机制，方便人们防范金融风险、管理市场和监督市场，毫无疑问都具有重大的现实意义和理论价值。金融时间序列是属于时间序列数据的一种，具有很强的时间性，数据前后具有很强的依赖性，且无法调整顺序，一般都是二维数据。现有的金融时间序列分析大多只考虑分析收盘价，但是股指每天都在最高价和最低价之间振荡，如果只分析收盘价，就丢失了很多有用的数据信息，这会造成预测的信息不全面，不能满足市场投资者的要求。这就要求需要对原始的金融数据进行深度的清洗后抽取更为有效的特征，完善预测模型。受市场噪声和政策易变特征的影响，股票市场预测通常被认为是金融时间序列预测中最具挑战性的问题之一。如何准确预测股票走势仍然是经济、社会领域中的一个悬而未决的问题。在过去的几十年中，机器学习模型，例如人工神经网络(ANNs)和支持向量回归(SVR)，已被广泛应用于股票走势预测，并获得一定的预测成果。考虑到金融时间序列特别是股票时间序列的复杂性，将深度学习与金融市场预测相结合被认为是金融领域发展...

【技术保护点】
1.一种基于长短记忆网络与深度数据清洗的金融时间序列预测方法，其特征在于，包括下述步骤：(1)采用窗口宽度为W的滑动窗口实时截取股票金融时间序列数据，并对截取的数据进行经验模态分解后获得本征模态函数序列；(2)采用降维处理对本征模态函数序列中的冗余数据进行压缩；(3)采用堆叠自动编码器对降维得到的数据进行无监督学习，获得金融时间序列的深层特征；(4)将金融时间序列的深层特征按照比例分为训练集、验证集和测试集，并采用训练集对时间循环神经网络模型进行训练后获得训练好的时间循环神经网络模型；(5)根据训练好的时间循环神经网络模型对金融时间序列进行预测。

【技术特征摘要】
1.一种基于长短记忆网络与深度数据清洗的金融时间序列预测方法，其特征在于，包括下述步骤：(1)采用窗口宽度为W的滑动窗口实时截取股票金融时间序列数据，并对截取的数据进行经验模态分解后获得本征模态函数序列；(2)采用降维处理对本征模态函数序列中的冗余数据进行压缩；(3)采用堆叠自动编码器对降维得到的数据进行无监督学习，获得金融时间序列的深层特征；(4)将金融时间序列的深层特征按照比例分为训练集、验证集和测试集，并采用训练集对时间循环神经网络模型进行训练后获得训练好的时间循环神经网络模型；(5)根据训练好的时间循环神经网络模型对金融时间序列进行预测。2.如权利要求1所述的金融时间序列预测方法，其特征在于，步骤(1)中，股票金融时间序列数据为：F(t)＝(F.O(t),F.C(t),F.H(t),F.L(t))，其中F.O(t),F.C(t),F.H(t),F.L(t)分别表示交易日当天的开盘价、收盘价、最高价和最低价。3.如权利要求2所述的金融时间序列预测方法，其特征在于，对截取的数据进行经验模态分解后获得本征模态函数序列具体包括：获取股票金融时间序列F(t)所有的极大值点，并采用三次样条插值函数拟合形成原数据的上包络线；获取股票金融时间序列F(t)所有的极小值点，并将所有的极小值点通过三次样条插值函数拟合形成数据的下包络线；获得所述上包络线和所述下包络线的均值m，并将原数据序列F(t)减去包络的平均值m后获得新的数据序列h＝F(t)-m；判断新的数据序列h是否还存在负的局部极大值和正的局部极小值，若是，则通过数据的特征时间尺度来获得本征波动模式并对新的数据序...

【专利技术属性】
技术研发人员：李振军，谭舜泉，倪良宇，陆芸婷，
申请(专利权)人：深圳大学，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人