一种时序数据预测方法、装置及设备制造方法及图纸

技术编号:18668333 阅读:27 留言:0更新日期:2018-08-14 20:39
本发明专利技术公开了一种时序数据预测方法、装置及设备,其中该方法包括:获取历史时序数据,并对所述历史时序数据进行数据清洗及数据切片,得到对应的时序数据序列;对所述时序数据序列进行平稳化操作,并采用免疫遗传特征重构算法对进行平稳化操作后的时序数据序列进行特征重构,得到对应的特征序列;获取基于所述特征序列训练得到的深度学习模型,并利用所述深度学习模型进行时序数据预测。可见,本申请不同于现有技术中通过抽样方法实现数据集特征的采集,而是通过上述数据预处理、平稳化操作及特征重构等步骤保证了获取的时序数据特征的有效性,进而使得深度学习模型能够学习到时序数据的时序特征,保证了深度学习模型的预测准确性。

Prediction method, device and equipment for time series data

The invention discloses a timing data prediction method, device and device, wherein the method comprises: acquiring historical timing data, cleaning and slicing the historical timing data, obtaining corresponding timing data sequence, smoothing the timing data sequence and adopting immune genetic algorithm. The feature reconstruction algorithm reconstructs the sequence of time series data after smoothing operation to get the corresponding feature sequence; obtains the depth learning model based on the feature sequence training, and uses the depth learning model to predict the time series data. It can be seen that this application is different from the sampling method in the existing technology to realize the collection of data set features, but through the above steps of data preprocessing, smoothing operation and feature reconstruction to ensure the effectiveness of the acquired time series data features, so that the depth learning model can learn the time series characteristics of the time series data, to ensure that The prediction accuracy of the depth learning model is verified.

【技术实现步骤摘要】
一种时序数据预测方法、装置及设备
本专利技术涉及深度学习
,更具体地说,涉及一种时序数据预测方法、装置及设备。
技术介绍
“汇率”简称为ExRate,亦称“外汇牌价”、“外汇行市”或“汇价”等,是一种货币兑换另一种货币的比率,反应币中间相对价格的变动;随着全球浮动汇率制度的合法化和世界经济一体化趋势的加强,外汇作为重要的资本元素,成为了众多资本产品的重要组成,因此对其的预测引起了社会各界投资人士和证券市场的关注。近年来,随着启发式算法的发展,各类机器学习算法被应用于汇率预测,具体来说,现有技术中提出采用广义自回归神经网络(GRNN)模型来模拟汇率的非线性变化,但是此类静态网络模型需要通过随机抽样的方法学习输入数据集的特征,这使得模型无法学习到汇率变化的时序特征。综上所述,现有技术中用于实现汇率预测的技术方案存在模型无法学习到汇率变化的时序特征的问题。
技术实现思路
本专利技术的目的是提供一种时序数据预测方法、装置及设备,能够通过时序数据序列特征的确定使得模型能够有效学习到汇率变化的时序特征。为了实现上述目的,本专利技术提供如下技术方案:一种时序数据预测方法,包括:获取历史时序数据,并对所述历史时序数据进行数据清洗及数据切片,得到对应的时序数据序列;对所述时序数据序列进行平稳化操作,并采用免疫遗传特征重构算法对进行平稳化操作后的时序数据序列进行特征重构,得到对应的特征序列;获取基于所述特征序列训练得到的深度学习模型,并利用所述深度学习模型进行时序数据预测。优选的,利用所述深度学习模型进行时序数据预测之前,还包括:基于所述特征序列计算所述深度学习模型的预测精度,如果所述预测精度符合预设要求,则确定所述深度学习模型能够用于进行时序数据预测,否则,则确定所述深度学习模型无法用于进行时序数据预测。优选的,利用所述特征序列计算所述深度学习模型的预测精度,包括:获取训练集及测试集,所述训练集及所述测试集为将所述特征序列划分为多个子序列后将所述多个子序列分组得到的,其中所述深度学习模型为基于所述训练集训练得到的;将所述训练集中包含的每个子序列分别输入所述深度学习模型,并利用所述深度学习模型输出的每个时序数据与对应实际时序数据之间的残差组成训练残差序列;将所述测试集中包含的每个子序列分别输入所述深度学习模型,并利用所述深度学习模型输出的每个时序数据与对应实际时序数据之间的残差组成测试残差序列;利用LB检验技术分别计算所述训练残差序列的LB值及所述测试残差序列的LB值;对应的,判断所述预测精度是否达到预设要求,包括:将所述训练集及所述测试集对应的LB值分别与预设要求进行比对,如果所述训练集及所述测试集对应的LB值均符合预设要求,则确定所述深度学习模型能够用于进行时序数据预测,否则,则确定所述深度学习模型无法用于进行时序数据预测。优选的,将所述训练集及所述测试集对应的LB值分别与预设要求进行比对之后,还包括:如果所述测试集对应LB值不符合所述预设要求且所述训练集对应LB值符合所述预设要求,则返回执行所述采用免疫遗传特征重构算法对进行平稳化操作后的时序数据序列进行特征重构的步骤,直至所述训练集及所述测试集对应LB值均符合预设要求为止。优选的,采用免疫遗传特征重构算法对进行平稳化操作后的时序数据序列进行特征重构得到对应特征序列,包括:按照下列公式得到进行平稳化操作后的时序数据序列x的时序数据残差的导数向量X:X=[x,x',x(2),...,x(n)]T;获取下列基于导数向量X得到对应特征序列的公式:获取下列亲和度评价函数:其中,A为n×n的方阵,B为n×1的列向量,n为特征变换的阶数,m为输入基于每个训练集得到的深度学习模型的序列的长度,为将所述训练集中子序列输入对应深度学习模型后该深度学习模型输出的时序数据,Y表示与所述深度学习模型输出的时序数据对应的实际时序数据,N为所述训练集中子序列的数量,所述深度学习模型、所述训练集及所述亲和度评价函数的值一一对应;其中所述训练集的获取过程包括:确定与生成的每组A和B的值对应的特征序列,将每个所述特征序列划分为多个子序列,并将所述多个子序列分组得到与每个所述特征序列对应的训练集及测试集;采用免疫遗传特征重构算法确定出使得所述亲和度评价函数的值最低的A和B的值,并确定该A和B的值对应特征序列为最终确定出的特征重构得到的特征序列。优选的,采用免疫遗传特征重构算法确定出使得所述亲和度评价函数的值最低的A和B的值,包括:生成多个抗体,每个抗体对应一组A和B的值;将对应A为奇异阵的抗体消除,并将与记忆库中的抗体相匹配的抗体消除,所述记忆库包含的抗体为预先测试得到的非法的抗体;计算每个抗体对应的亲和度评价函数的值,判断是否满足任一终止条件,如果是,则确定亲和度评价函数的值最小的抗体为最佳匹配抗体,并确定所述最佳匹配抗体对应的A和B的值为使得所述亲和度评价函数的值最低的A和B的值;如果否,则将所述多个抗体按照前两位数值分类,并对每一类中的抗体实行遗传变异操作,得到新的抗体,并基于新的抗体返回执行将对应A为奇异阵的抗体消除的步骤;其中所述终止条件包括:存在某个抗体对应亲和度评价函数的值低于预定阈值、返回执行将对应A为奇异阵的抗体消除的步骤的次数达到预设次数、确定出的亲和度评价函数的值最小的抗体连续预设次未发生变化。优选的,对每一类中的抗体实行遗传变异操作,得到新的抗体,包括:确定每一类抗体为一个父代,并获取复制、交叉及变异的比例分别为p、q、r;从每个父代中选取亲和度评价函数的值最小的pK个抗体,保留到子代中;从每个父代中随机选取qK/2对抗体,并将每对抗体的第i位及后面的序列互换,将互换后得到的抗体保留到子代中;从每个父代中随机选取rK个抗体,用预先设定的取值域中一个随机数替换每个抗体的第j位,将替换得到的抗体保留到子代中;其中,K为每一类的抗体数量、i和j均为随机数;确定全部子代包括的抗体均为遗传变异操作得到新的抗体。优选的,获取基于所述特征序列训练得到的深度学习模型,包括:获取基于所述特征序列训练得到的GRU模型。一种时序数据预测装置,包括:预处理模块,用于:获取历史时序数据,并对所述历史时序数据进行数据清洗及数据切片,得到对应的时序数据序列;特征重构模块,用于:对所述时序数据序列进行平稳化操作,并采用免疫遗传特征重构算法对进行平稳化操作后的时序数据序列进行特征重构,得到对应的特征序列;预测模块,用于:获取基于所述特征序列训练得到的深度学习模型,并利用所述深度学习模型进行时序数据预测。一种时序数据预测设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现如上任一项所述时序数据预测方法的步骤。本专利技术提供了一种时序数据预测方法、装置及设备,其中该方法包括:获取历史时序数据,并对所述历史时序数据进行数据清洗及数据切片,得到对应的时序数据序列;对所述时序数据序列进行平稳化操作,并采用免疫遗传特征重构算法对进行平稳化操作后的时序数据序列进行特征重构,得到对应的特征序列;获取基于所述特征序列训练得到的深度学习模型,并利用所述深度学习模型进行时序数据预测。本专利技术提供的上述技术方案中,通过数据清洗及数据切片保证了历史时序数据的完整性及准确性,通过对时序数据序列进行平稳化操作,保证了时本文档来自技高网...

【技术保护点】
1.一种时序数据预测方法,其特征在于,包括:获取历史时序数据,并对所述历史时序数据进行数据清洗及数据切片,得到对应的时序数据序列;对所述时序数据序列进行平稳化操作,并采用免疫遗传特征重构算法对进行平稳化操作后的时序数据序列进行特征重构,得到对应的特征序列;获取基于所述特征序列训练得到的深度学习模型,并利用所述深度学习模型进行时序数据预测。

【技术特征摘要】
1.一种时序数据预测方法,其特征在于,包括:获取历史时序数据,并对所述历史时序数据进行数据清洗及数据切片,得到对应的时序数据序列;对所述时序数据序列进行平稳化操作,并采用免疫遗传特征重构算法对进行平稳化操作后的时序数据序列进行特征重构,得到对应的特征序列;获取基于所述特征序列训练得到的深度学习模型,并利用所述深度学习模型进行时序数据预测。2.根据权利要求1所述的方法,其特征在于,利用所述深度学习模型进行时序数据预测之前,还包括:基于所述特征序列计算所述深度学习模型的预测精度,如果所述预测精度符合预设要求,则确定所述深度学习模型能够用于进行时序数据预测,否则,则确定所述深度学习模型无法用于进行时序数据预测。3.根据权利要求2所述的方法,其特征在于,利用所述特征序列计算所述深度学习模型的预测精度,包括:获取训练集及测试集,所述训练集及所述测试集为将所述特征序列划分为多个子序列后将所述多个子序列分组得到的,其中所述深度学习模型为基于所述训练集训练得到的;将所述训练集中包含的每个子序列分别输入所述深度学习模型,并利用所述深度学习模型输出的每个时序数据与对应实际时序数据之间的残差组成训练残差序列;将所述测试集中包含的每个子序列分别输入所述深度学习模型,并利用所述深度学习模型输出的每个时序数据与对应实际时序数据之间的残差组成测试残差序列;利用LB检验技术分别计算所述训练残差序列的LB值及所述测试残差序列的LB值;对应的,判断所述预测精度是否达到预设要求,包括:将所述训练集及所述测试集对应的LB值分别与预设要求进行比对,如果所述训练集及所述测试集对应的LB值均符合预设要求,则确定所述深度学习模型能够用于进行时序数据预测,否则,则确定所述深度学习模型无法用于进行时序数据预测。4.根据权利要求3所述的方法,其特征在于,将所述训练集及所述测试集对应的LB值分别与预设要求进行比对之后,还包括:如果所述测试集对应LB值不符合所述预设要求且所述训练集对应LB值符合所述预设要求,则返回执行所述采用免疫遗传特征重构算法对进行平稳化操作后的时序数据序列进行特征重构的步骤,直至所述训练集及所述测试集对应LB值均符合预设要求为止。5.根据权利要求1所述的方法,其特征在于,采用免疫遗传特征重构算法对进行平稳化操作后的时序数据序列进行特征重构得到对应特征序列,包括:按照下列公式得到进行平稳化操作后的时序数据序列x的时序数据残差的导数向量X:X=[x,x',x(2),...,x(n)]T;获取下列基于导数向量X得到对应特征序列的公式:获取下列亲和度评价函数:其中,A为n×n的方阵,B为n×1的列向量,n为特征变换的阶数,m为输入基于每个训练集得到的深度学习模型的序列的长度,为将所述训练集中子序列输入对应深度学习模型后该深度学习模型输出的时序数据,Y表示与所述深度学习模型输出的时序数据对应的实际时序数据,N为所述训练集中子序列的数量,所...

【专利技术属性】
技术研发人员:李峰
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1