一种基于长短时记忆网络模型的短时数据流预测方法技术

技术编号:18019281 阅读:119 留言:0更新日期:2018-05-23 05:22
本发明专利技术公开了一种基于长短时记忆网络模型的短时数据流预测方法,步骤为:首先获取观测点中的多个训练样本,然后提取练样本的特征,根据训练样本的特征对训练样本进行分类,分别为数据流量值变化趋势剧烈和平缓两个类型、或变化趋势上升和下降两个类型;采用所有训练样本针对LSTM模型进行训练,得到训练后的主模型,再分别采用两种类型的训练样本分别对主模型进行训练,分别得到第一类子模型和第二类子模型。获取观测点测试样本,通过分类器对测试样本进行分类,然后根据分类结果将测试样本输入到第一类子模型或第二类子模型中,通过第一类子模型或第二类子模型预测出观测点下一时间点的数量流量值。本发明专利技术方法提高了短时数据流预测的准确度。

【技术实现步骤摘要】
一种基于长短时记忆网络模型的短时数据流预测方法
本专利技术属于模式识别与人工智能
,特别涉及一种基于长短时记忆网络模型的短时数据流预测方法。
技术介绍
随着世界经济的持续稳定发展,在许多国家的服务都是数据流,例如网络负载流量和交通流量,代表了其服务的特点,而预测则是优化这些服务最好办法,例如预测互联网的负载数据,对下一个时刻的调度提供给更适合的资源调度;对于交通流量的预测,则是可以优化交通资源的配置。目前,许多用于短时数据流预测的方法都是用单个模型做预测,然而数据流量是一种具有非线性和随机性的信号,多种混合成分难以判别和分离。因此单个模型的预测效果存在瓶颈,当一个模型对拥堵情况下的数据流有较好的预测效果时,往往对畅通情况下的数据流预测效果有待改进,因此现有的短时数据流预测方法存在预测精度不高的缺陷。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提供一种基于长短时记忆(LongShortTermMemory,LSTM)网络模型的短时数据流预测方法,该方法能够更加精确的预测出短时数据流。本专利技术的目的通过下述技术方案实现:一种基于长短时记忆网络模型的短时数据流预测方法,步骤如下:步骤S1、针对于需要预测短时数据流的观测点,首先在该观测点处采集历史的多个时间点统计的数据流量值,然后按照时间顺序,将上述采集的历史的每个时间点统计的数据流量值拼接聚合为一维数组并做归一化处理;其中上述每两个相邻时间点的时间间隔相同,均为T分钟;每个时间点统计的数据流量值指的是上一时间点至该时间点这段时间间隔内产生的数据流量;步骤S2、针对于步骤S1得到的归一化后的一维数组,进行滑动窗的加窗处理,得到多个训练样本,并且将每个训练样本中统计的数据流量值对应为最后一个时间点的下一时间点统计的数据流量值作为该训练样本的标签;其中每个训练样本中包括多个时间点统计的数据流量值;步骤S3、提取训练样本的特征:针对于训练样本做一阶差分处理得到训练样本的特征;根据训练样本的特征对训练样本做聚类处理,分离出数据流量值变化趋势剧烈和平缓的两个类型的训练样本,或者分离出数据流量值变化趋势上升和下降的两个类型的训练样本;步骤S4、获取模型参数初始化后的LSTM模型;然后对LSTM模型进行训练,具体为:首先将所有训练样本中各个训练样本作为输入、各个训练样本对应的标签作为输出对LSTM模型进行训练,得到训练后的主模型;然后将步骤S3获取到的数据流量值变化趋势剧烈或上升的一类训练样本输入到上述训练后的主模型中进行训练,得到第一类子模型;同时将步骤S3获取到的数据流量值变化趋势平缓或下降的一类训练样本输入到上述训练后的主模型中进行训练,得到第二类子模型;步骤S5、在当前时间点要预测观测点下一时间点统计的数据流量值时,首先通过滑动窗获取该观测点当前时间点及其前面多个时间点统计的归一化后的数据流量值所构成的样本,将该样本作为测试样本;其中测试样本中,每两个相邻的时间点的时间间隔相同,均为T1分钟;其中T1=T;需要预测数据流量值的下一时间点和当前时间点的时间间隔也为T分钟;步骤S6、提取测试样本的特征:针对于测试样本做一阶差分处理得到测试样本的特征;然后由分类器根据测试样本的特征判断出测试样本是属于数据流量值变化趋势剧烈或上升的样本,还是属于数据流量值变化趋势平缓或下降的样本;其中上述分类器由将步骤S3中分离出类型的训练样本作为输入、训练样本所属类型作为输出训练得到;步骤S7、当测试样本属于数据流量值变化趋势剧烈或上升的样本,则将测试样本输入到步骤S4获取到的第一类子模型中,通过第一类子模型预测出观测点下一时间点统计的数据流量值;当测试样本属于数据流量值变化趋势平缓或下降的样本,则将测试样本输入到步骤S4获取到的第二类子模型中,通过第二类子模型预测出观测点下一时间点统计的数据流量值。优选的,所述步骤S1中,针对于拼接聚合后得到的一维数组,通过以下方式进行归一化处理:其中xf是一维数组中的第f维;xmin和xmax分别对应为拼接聚合后的一维数组中的最大值和最小值。优选的,所述滑动窗的长度为N,其中当数据流为交通数据流时,滑动窗的长度和每两个相邻时间点的时间间隔T的乘积满足以下关系:N×T≤60。更进一步的,所述步骤S1中,所述步骤S1中,当数据流为交通数据流时,T≤30;当观测点历史是每E分钟统计一次数据流量时,则T为E、2E,…,(n-1)E或nE,其中n和E均为一定值,nE≤30。更进一步的,当T为Y分钟时,则滑动窗的长度N为2至60/Y中的其中一个整数值。优选的,所述步骤S3中,若数据流为交通数据流,则训练样本的特征提取过程如下:针对于训练样本做一阶差分处理,并对每个一阶差分的结果取绝对值,作为训练样本的特征;其中当训练样本为[xtxt-1...xt-N+1]时,则进行一阶差分处理后,得到:[xt-xt-1,xt-1-xt-2,...xt-N+2-xt-N+1];其中xt、xt-1,...,xt-N+1分别对应为时间点t、t-1,…,t-N+1统计的数据流量值;N为滑动窗的长度;所述步骤S3中得到训练样本的特征为:[|xt-xt-1|,|xt-1-xt-2|,...|xt-N+2-xt-N+1|];所述步骤S3中,若数据流为网络负载数据流,则训练样本的特征提取过程如下:针对于训练样本做一阶差分处理,将训练样本的一阶差分结果作为训练样本的特征;其中当训练样本为[xtxt-1...xt-N+1]时,则进行一阶差分处理得到训练样本的特征为:[xt-xt-1,xt-1-xt-2,...xt-N+2-xt-N+1]。优选的,所述步骤S3中,根据训练样本的特征,通过K-均值聚类针对所有训练样本进行分离,以分离出数据流量值变化趋势剧烈和数据流量值变化趋势平缓的两类训练样本,或分离出数据流量值变化趋势上升和下降的两类训练样本。优选的,所述步骤S4中,对LSTM模型进行初始化时,首先生成指定维度分部的矩阵,然后进行奇异值分解产生矩阵U、矩阵Σ和矩阵V三个矩阵,以矩阵U作为LSTM模型隐藏层中输入门、遗忘门、输出门和候选状态值的权重矩阵的初始值,将LSTM模型中偏置向量均取为0。优选的,步骤S6中,所述分类器为K近邻分类器。优选的,所述步骤S6中,若数据流为交通数据流,则测试样本的特征提取过程如下:针对于测试样本做一阶差分处理,将测试样本的一阶差分结果作为训练样本的特征;其中当获取到测试样本为[xt′xt′-1...xt′-N+1]时,则进行一阶差分处理后,得到:[xt′-xt′-1,xt′-1-xt′-2,...xt′-N+2-xt′-N+1];其中xt′为当前时间点t′统计的数据流量值xt′-1,...,xt′-N+1分别对应为时间点t、t-1,…,t-N+1统计的数据流量值;N为滑动窗的长度;所述步骤S6中得到测试样本的特征为:[|xt′-xt′-1|,|xt′-1-xt′-2|,...|xt′-N+2-xt′-N+1|];所述步骤S6中,若数据流为网络负载数据流,则测试样本的特征提取过程如下:针对于测试样本做一阶差分处理,将测试样本的一阶差分结果作为测试样本的特征;其中当获取到测试样本为[xt′xt′-1...xt′-N+1]时,则进行一阶差分处理得到本文档来自技高网...
一种基于长短时记忆网络模型的短时数据流预测方法

【技术保护点】
一种基于长短时记忆网络模型的短时数据流预测方法,其特征在于,步骤如下:步骤S1、针对于需要预测短时数据流的观测点,首先在该观测点处采集历史的多个时间点统计的数据流量值,然后按照时间顺序,将上述采集的历史的每个时间点统计的数据流量值拼接聚合为一维数组并做归一化处理;其中上述每两个相邻时间点的时间间隔相同,均为T分钟;每个时间点统计的数据流量值指的是上一时间点至该时间点这段时间间隔内产生的数据流量;步骤S2、针对于步骤S1得到的归一化后的一维数组,进行滑动窗的加窗处理,得到多个训练样本,并且将每个训练样本中统计的数据流量值对应为最后一个时间点的下一时间点统计的数据流量值作为该训练样本的标签;其中每个训练样本中包括多个时间点统计的数据流量值;步骤S3、提取训练样本的特征:针对于训练样本做一阶差分处理得到训练样本的特征;根据训练样本的特征对训练样本做聚类处理,分离出数据流量值变化趋势剧烈和平缓的两个类型的训练样本,或者分离出数据流量值变化趋势上升和下降的两个类型的训练样本;步骤S4、获取模型参数初始化后的LSTM模型;然后对LSTM模型进行训练,具体为:首先将所有训练样本中各个训练样本作为输入、各个训练样本对应的标签作为输出对LSTM模型进行训练,得到训练后的主模型;然后将步骤S3获取到的数据流量值变化趋势剧烈或上升的一类训练样本输入到上述训练后的主模型中进行训练,得到第一类子模型;同时将步骤S3获取到的数据流量值变化趋势平缓或下降的一类训练样本输入到上述训练后的主模型中进行训练,得到第二类子模型;步骤S5、在当前时间点要预测观测点下一时间点统计的数据流量值时,首先通过滑动窗获取该观测点当前时间点及其前面多个时间点统计的归一化后的数据流量值所构成的样本,将该样本作为测试样本;其中测试样本中,每两个相邻的时间点的时间间隔相同,均为T1分钟;其中T1=T;需要预测数据流量值的下一时间点和当前时间点的时间间隔也为T分钟;步骤S6、提取测试样本的特征:针对于测试样本做一阶差分处理得到测试样本的特征;然后由分类器根据测试样本的特征判断出测试样本是属于数据流量值变化趋势剧烈或上升的样本,还是属于数据流量值变化趋势平缓或下降的样本;其中上述分类器由将步骤S3中分离出类型的训练样本作为输入、训练样本所属类型作为输出训练得到;步骤S7、当测试样本属于数据流量值变化趋势剧烈或上升的样本,则将测试样本输入到步骤S4获取到的第一类子模型中,通过第一类子模型预测出观测点下一时间点统计的数据流量值;当测试样本属于数据流量值变化趋势平缓或下降的样本,则将测试样本输入到步骤S4获取到的第二类子模型中,通过第二类子模型预测出观测点下一时间点统计的数据流量值。...

【技术特征摘要】
1.一种基于长短时记忆网络模型的短时数据流预测方法,其特征在于,步骤如下:步骤S1、针对于需要预测短时数据流的观测点,首先在该观测点处采集历史的多个时间点统计的数据流量值,然后按照时间顺序,将上述采集的历史的每个时间点统计的数据流量值拼接聚合为一维数组并做归一化处理;其中上述每两个相邻时间点的时间间隔相同,均为T分钟;每个时间点统计的数据流量值指的是上一时间点至该时间点这段时间间隔内产生的数据流量;步骤S2、针对于步骤S1得到的归一化后的一维数组,进行滑动窗的加窗处理,得到多个训练样本,并且将每个训练样本中统计的数据流量值对应为最后一个时间点的下一时间点统计的数据流量值作为该训练样本的标签;其中每个训练样本中包括多个时间点统计的数据流量值;步骤S3、提取训练样本的特征:针对于训练样本做一阶差分处理得到训练样本的特征;根据训练样本的特征对训练样本做聚类处理,分离出数据流量值变化趋势剧烈和平缓的两个类型的训练样本,或者分离出数据流量值变化趋势上升和下降的两个类型的训练样本;步骤S4、获取模型参数初始化后的LSTM模型;然后对LSTM模型进行训练,具体为:首先将所有训练样本中各个训练样本作为输入、各个训练样本对应的标签作为输出对LSTM模型进行训练,得到训练后的主模型;然后将步骤S3获取到的数据流量值变化趋势剧烈或上升的一类训练样本输入到上述训练后的主模型中进行训练,得到第一类子模型;同时将步骤S3获取到的数据流量值变化趋势平缓或下降的一类训练样本输入到上述训练后的主模型中进行训练,得到第二类子模型;步骤S5、在当前时间点要预测观测点下一时间点统计的数据流量值时,首先通过滑动窗获取该观测点当前时间点及其前面多个时间点统计的归一化后的数据流量值所构成的样本,将该样本作为测试样本;其中测试样本中,每两个相邻的时间点的时间间隔相同,均为T1分钟;其中T1=T;需要预测数据流量值的下一时间点和当前时间点的时间间隔也为T分钟;步骤S6、提取测试样本的特征:针对于测试样本做一阶差分处理得到测试样本的特征;然后由分类器根据测试样本的特征判断出测试样本是属于数据流量值变化趋势剧烈或上升的样本,还是属于数据流量值变化趋势平缓或下降的样本;其中上述分类器由将步骤S3中分离出类型的训练样本作为输入、训练样本所属类型作为输出训练得到;步骤S7、当测试样本属于数据流量值变化趋势剧烈或上升的样本,则将测试样本输入到步骤S4获取到的第一类子模型中,通过第一类子模型预测出观测点下一时间点统计的数据流量值;当测试样本属于数据流量值变化趋势平缓或下降的样本,则将测试样本输入到步骤S4获取到的第二类子模型中,通过第二类子模型预测出观测点下一时间点统计的数据流量值。2.根据权利要求1所述的基于长短时记忆网络模型的短时数据流预测方法,其特征在于,所述步骤S1中,针对于拼接聚合后得到的一维数组,通过以下方式进行归一化处理:其中xf是一维数组中的第f维;xmin和xmax分别对应为拼接聚合后的一维数组中的最大值和最小值。3.根据权利要求1所述的基于长短时记忆网络模型的短时数据流预测方法,其特征在于,所述滑动窗的长度为N,其中当数据流为交通数据流时,滑动窗的长度和每两个相邻时间点的时间间隔T的乘积满足以下关系:N×T≤60。4.根据权利要求3所述的基于长短时记忆网络模型的短时数据流预测方法,其特征在于,所述步骤S1中,所述步骤S1中,当数据流为交通数据流时,T≤30;当观测点历史...

【专利技术属性】
技术研发人员:薛洋薛泽龙李磊
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1