一种数据波动趋势的预测方法及装置制造方法及图纸

技术编号：24252375 阅读：62 留言：0更新日期：2020-05-23 00:00

本发明专利技术实施例提供了一种数据波动趋势的预测方法及装置，通过获取统计数据集，其中，统计数据集包括预设时间段内各时间周期统计的数据；将预设时间段内各时间周期统计的数据输入预先训练的长短期记忆LSTM网络模型中，得到第一似然值序列，其中，LSTM网络模型基于多个样本数据训练得到；根据第一似然值序列，对待预测时间周期的数据波动趋势进行预测，其中，待预测时间周期为预设时间段内最后一个时间周期的下一时间周期。由于LSTM网络模型是一个端到端的网络模型，将预设时间段内各时间周期统计的数据输入预先训练的LSTM网络模型后，可以快速得到一个似然值序列的输出，基于该输出，缩短了待预测时间周期的数据波动趋势的预测时间，从而提高了预测效率。

A prediction method and device of data fluctuation trend

全部详细技术资料下载

【技术实现步骤摘要】
一种数据波动趋势的预测方法及装置
本专利技术涉及通信
，特别是涉及一种数据波动趋势的预测方法及装置。
技术介绍
随着互联网信息时代的快速发展，数据的获取速度越来越迅速，并且获取到的数据对人们的影响也越来越大。例如，人们可以通过历史时间段内的股价、股票新闻等股票信息预测未来时间的股票涨跌趋势；也可以通过历史时间段内的天气信息预测未来时间的天气变化趋势。因此，如何通过多个历史数据对未来时间的数据波动趋势进行预测成为了研究热点。相关技术中，将历史时间段内各时间周期的数据输入耦合隐马尔可夫网络模型中，得到可以代表事物变化趋势的对数似然值序列，然后再根据对数似然值序列，对未来时间周期的数据波动趋势进行预测。然而，耦合隐马尔可夫网络模型虽然有严密的概率推导过程，但它也保留了传统概率图模型的缺点，其缺点为模型计算量大，训练时间长等，从而导致预测效率较低。
技术实现思路
本专利技术实施例的目的在于提供一种数据波动趋势的预测方法及装置，以实现提高预测效率。具体技术方案如下：第一方面，本专利技术...

【技术保护点】
1.一种数据波动趋势的预测方法，其特征在于，所述方法包括：/n获取统计数据集，其中，所述统计数据集包括预设时间段内各时间周期统计的数据；/n将统计数据集输入预先训练的长短期记忆LSTM网络模型中，得到第一似然值序列，其中，所述第一似然值序列包括各时间周期对应的似然值，所述似然值表征一个时间周期内的数据波动趋势；/n基于所述第一似然值序列，对待预测时间周期内的数据波动趋势进行预测，其中，所述待预测时间周期为所述预设时间段的下一个时间周期。/n

【技术特征摘要】
1.一种数据波动趋势的预测方法，其特征在于，所述方法包括：
获取统计数据集，其中，所述统计数据集包括预设时间段内各时间周期统计的数据；
将统计数据集输入预先训练的长短期记忆LSTM网络模型中，得到第一似然值序列，其中，所述第一似然值序列包括各时间周期对应的似然值，所述似然值表征一个时间周期内的数据波动趋势；
基于所述第一似然值序列，对待预测时间周期内的数据波动趋势进行预测，其中，所述待预测时间周期为所述预设时间段的下一个时间周期。

2.根据权利要求1所述的方法，其特征在于，所述LSTM网络模型的训练过程，包括：
针对各组样本统计数据集，将该组样本统计数据集输入LSTM网络中，得到第一似然值序列，并将该组样本统计数据集输入耦合隐马尔可夫网络模型中，得到第二似然值序列；
比较所述第一似然值序列与所述第二似然值序列，得到损失值；
基于所述损失值，调整所述LSTM网络的网络参数；
在确定调整网络参数后的LSTM网络收敛时，完成训练，得到LSTM网络模型。

3.根据权利要求1所述的方法，其特征在于，所述基于所述第一似然值序列，对待预测时间周期内的数据波动趋势进行预测，包括：
分别计算所述第一似然值序列中除尾部似然值以外的其他各似然值与所述尾部似然值的差值绝对值；
从所述第一似然值序列中读取指定时间周期对应的似然值，并从所述统计数据集中读取所述指定时间周期统计的数据，其中，所述指定时间周期为差值绝对值小于预设阈值时似然值所对应的时间周期；
根据所述指定时间周期对应的似然值和所述指定时间周期统计的数据，对待预测时间周期内的数据波动趋势进行预测。

4.根据权利要求3所述的方法，其特征在于，所述根据所述指定时间周期对应的似然值和所述指定时间周期统计的数据，对待预测时间周期内的数据波动趋势进行预测，包括：
根据所述指定时间周期对应的似然值和所述指定时间周期统计的数据，利用预设最小化公式，对待预测时间周期的数据波动趋势进行预测，所述预设最小化公式为：

其中，N为数据总数，T为时间周期的长度，V为所述指定时间周期的数量的2倍，为数据s的权重，为待预测时间周期i内数据s的数据涨跌概率，表示数据s邻居时间周期j内的数据概率分布，表示数据s的邻居时间周期j内数据的真实标签，表示使数据s的邻居时间周期j和真实标签具有相似的概率分布。

5.根据权利要求3所述的方法，其特征在于，所述根据所述指定时间周期对应的似然值和所述指定时间周期统计的数据，对待预测时间周期内的数据波动趋势进行预测，包括：
根据所述指定时间周期对应的似然值和所述指定时间周期统计的数据，利用预设正则化公式，对待预测时间周期的数据波动趋势进行预测，所述预设正则化公式为：

其中，λ为正则化系数，Δ为正则项，N为数据总数，T为时间周期的长度，V为所述指定时间周期的数量的2倍，为数据s的权重，为待预测时间周期i内数据s的数据涨跌概率，表示数据s邻居时间周期j内的数据概率分布，表示数据s的邻居时间周期j内数据的真实标签，表示使数据s的邻居时间周期j和真实标签具有相似的概率分布。

6.一种数据波动...

【专利技术属性】
技术研发人员：张熙，李奕萱，李小勇，王春露，方滨兴，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人