一种基于相关性分析的LSTM网络发电多步预测方法技术

技术编号:26067515 阅读:23 留言:0更新日期:2020-10-28 16:40
本发明专利技术公开了一种基于相关性分析的LSTM网络发电多步预测方法。本发明专利技术首先通过R/S分析法计算各变量的赫斯特指数,剔除本身不具有相关性的变量;然后利用灰色关联法计算各变量与发电量的关联度,进一步剔除出与光伏发电量关联度小的变量,选择关联度大的变量来进行训练;最后,利用W.Pedrycz的粒化方法对训练变量进行预处理,构建改进的长短时记忆LSTM网络对光伏发电量进行多步预测。通过分析利用筛选前、后变量进行光伏发电量多步预测仿真图和均方误差,证明了本发明专利技术提出的相关性分析方法和构建改进的LSTM网络的有效性,对解决具有相关性变量的多步预测问题具有很重要的意义。

【技术实现步骤摘要】
一种基于相关性分析的LSTM网络发电多步预测方法
本专利技术属于预测分析领域,具体涉及一种基于变量相关性分析的LSTM网络光伏发电多步预测方法。
技术介绍
太阳能光伏发电蕴藏着巨大的能量,是一种可再生的清洁能源。但是光伏发电受多变量影响,呈现较强的波动性和间歇性。若能够精确预测光伏发电量和实现对未来有效长度的多步预测将对于电量的控制、优化和未来的调度有着至关重要的意义。常见的时间序列预测方法和模型很多,基于智能预测算法,典型的有小波分析、支持向量机、人工神经网络法等,尽管这类网络在非线性预测领域发挥了重要的作用,但由于样本输入节点之间相互离散,网络本身并不关注输入节点的时序关系,导致数据在不同输入时序下会得到完全不同的结果,对具有时间序列的变量预测精度不理想。长短时记忆网络每个记忆单元引入了3个门,分别为输入门、遗忘门、输出门,从而在网络训练中能够实现根据数据内部的联系自发控制各门的开闭和记忆单元值的更新,并赋予网络可变的“记忆”长度,能够很好的解决时间序列问题。目前大多数LSTM预测网络并未对变量进行相关性分析,只是对变量数据进行简单的处理,直接进行训练。由于多特征多维度变量的相关性无法清晰表达、导致预测精度不理想。
技术实现思路
本专利技术针对以上出现的不足,设计一种基于变量相关性分析的LSTM网络光伏发电多步预测方法。本专利技术包括以下步骤:步骤一、利用R/S相关性分析剔除与发电量不相关性的变量所述的变量包括温度、气流、湿度、风速、地表最高温度、气压、降雨量和辐射量,根据R/S相关性分析法计算各个变量的赫斯特指数,筛选出具有相关性的变量。步骤二、计算具有相关性的变量与发电量之间关联值大小,剔除关联度小的变量。步骤三、利用W.Pedrycz的粒化方法对变量进行预处理用W.Pedrycz的粒化方法对变量的时间序列数据进行模糊粒化,主要分两个步骤:划分窗口和模糊化。所述划分窗口是将时间序列数据分割成若干小子序列,作为操作窗口;所述模糊化是将产生的每一个窗口进行模糊化,生成一个个模糊集也就是模糊信息粒。步骤四、构建长短时记忆网络对发电量进行多步预测(1)以上一单元的输出ht-1和本单元的输入xt通过sigmoid函数,为上一单元状态Ct-1中的每一项产生一个在[0,1]的ft值,来控制前一时刻单元状态保留的程度。由tanh函数产生一个新的候选向量通过组合作用为的每一项产生一个(1-ft)的值,控制当前时刻新信息加入的量;将前一时刻单元状态保留的量与当前时刻新信息值加入的量设为互补的两个值。利用前一时刻保留的单元状态值和当前时刻新加入信息值来更新当前的单元状态Ct值。(2)长短时记忆网络的输出门层决定模型的输出,通过sigmoid函数层为单元状态产生一个在[0,1]内的值ot,控制单元状态被过滤的程度,从而得到长短时记忆网络的输出ht。(3)利用构建好的长短时记忆网络进行预测设置长短时记忆网络参数,选用筛选后的变量,其中变量的前80%数据进行训练,后20%数据用于测试。将筛选后的变量作为长短时记忆网络的输入,层数设为4层;发电变量作为长短时记忆网络输出,层数设为3层,中间隐含层单元设为90*3个,设置长短时记忆网络的时间序列交替时间步数为3步,梯度阈值为1。本专利技术的有益效果:本专利技术首先通过R/S分析法,由Hurst指数对每个预测变量进行相关性分析,剔除本身不具有相关性的变量;其次利用灰色关联法分析法,确定各个预测变量与光伏发电量的关联程度大小,进一步剔除与发电量关联度低的变量,减小对无关变量的预测;最后对筛选后的变量数据进行W.Pedrycz粒化处理,构建能够进行多步预测的长短时记忆网络LSTM网络进行预测,从而增加光伏发电量预测的准确性和提高预测的效率。附图说明图1.是整个预测流程图;图2.是光伏发电量的赫斯特指数图;图3.是改进LSTM网络内部结构;图4.是光伏发电量的样本数据图;图5.是LSTM对原始未筛选变量对发电量的多步预测仿真图。图6.是LSTM对筛选后变量对发电量的多步预测仿真图。具体实施方式以下结合附图对本专利技术作进一步说明。本实施例利用清华大学气象站公布的2019年3月至6月以1个小时为单位每天24个小时的气象数据对模型的预测效果进行检验。附图1为本专利技术的具体操作流程图。包括以下各步骤:步骤一、利用R/S相关性分析剔除不具有相关性的变量Hurst指数的计算过程如下:(1)将总长度为M的序列Rt分为长度为n(n>3)的A(取N/n的整数部分)个连续子区间,即An=M。任一子区间可表示为Ia。其中a=1,2,…,A。在任一子区间Ia中的元素可表示为Rk,a,其中k=1,2,…,n。则任一子区间Ia的均值为:(2)计算每个子区间Ia偏离子区间均值的累积离差:(3)计算出每个子区间Ia的极差:Ra=man(Xk,a)-min(Xk,a),k=1,2,…,n(4)计算出每个子区间Ia的标准差:(5)计算出每个子区间Ia的重标极差:(R/S)a=Ra/Sa(6)对每个子区间重复上述步骤,得到重标极差的一个序列(R/S)a,计算这个序列的均值:将子区间的长度n增加到n+1,n+2,…,重复上述计算,直到长度n=N/2最后对方程log(R/S)n=logC+H*logn用最小二乘法进行估计,得到解释变量logn前的系数H即为所求的Hurst指数。赫斯特推得关系为:(R/S)n=c*nH,c为常数,n为观察值的个数,H为赫斯特指数,根据赫斯特指数值的不同,可以将变量序列分为三种类型:(1)0<H<0.5,说明说明变量序列是一种反相关性,即未来的变化趋势与过去趋势相反,且H越接近于0反持续性越强。(2)H=0.5,说明该变量序列是标准的随机游走序列,即未来变化趋势和过去趋势的增量没有关系。(3)0.5<H<1,说明该变量时间序列具有正相关和持久性,过去的增加趋势预示未来的增加趋势,过去的减少趋势预示着将来的减少趋势。H趋于1时,表示过去与将来关系密切。根据持久性与反持久性对时间序列未来的变化趋势可做出定量分析。计算气象站公布的各个变量得到对应的Hurst指数H值,结果如表1所示。由表1中数据可知,温度、湿度、气压、风速、辐射量和发电量的H指数均介于0.5到1之间,说明它们都具有正相关性,未来有和现在相同的变化趋势,在步骤二中继续进行灰色关联分析。而地表最高温度和降雨量的赫斯特指数约等于0.5,说明序列是标准的随机游走序列,变量没有相关性不能进行预测,予以剔除。附图2为发电量的赫斯特指数仿真图。表1各个变量对应H指数结果步骤二、计算具有相关性的变量与发电量之间关联度大小(1本文档来自技高网...

【技术保护点】
1.一种基于相关性分析的LSTM网络发电多步预测方法,其特征在于包括以下步骤:/n步骤一、利用R/S相关性分析剔除与发电量不相关性的变量/n所述的变量包括温度、气流、湿度、风速、地表最高温度、气压、降雨量和辐射量,根据R/S相关性分析法计算各个变量的赫斯特指数,筛选出具有相关性的变量;/n步骤二、计算具有相关性的变量与发电量之间关联值大小,剔除关联度小的变量;/n步骤三、利用W.Pedrycz的粒化方法对变量进行预处理/n用W.Pedrycz的粒化方法对变量的时间序列数据进行模糊粒化,主要分两个步骤:划分窗口和模糊化;/n所述划分窗口是将时间序列数据分割成若干小子序列,作为操作窗口;/n所述模糊化是将产生的每一个窗口进行模糊化,生成一个个模糊集也就是模糊信息粒;/n步骤四、构建长短时记忆网络对发电量进行多步预测/n(1)以上一单元的输出h

【技术特征摘要】
1.一种基于相关性分析的LSTM网络发电多步预测方法,其特征在于包括以下步骤:
步骤一、利用R/S相关性分析剔除与发电量不相关性的变量
所述的变量包括温度、气流、湿度、风速、地表最高温度、气压、降雨量和辐射量,根据R/S相关性分析法计算各个变量的赫斯特指数,筛选出具有相关性的变量;
步骤二、计算具有相关性的变量与发电量之间关联值大小,剔除关联度小的变量;
步骤三、利用W.Pedrycz的粒化方法对变量进行预处理
用W.Pedrycz的粒化方法对变量的时间序列数据进行模糊粒化,主要分两个步骤:划分窗口和模糊化;
所述划分窗口是将时间序列数据分割成若干小子序列,作为操作窗口;
所述模糊化是将产生的每一个窗口进行模糊化,生成一个个模糊集也就是模糊信息粒;
步骤四、构建长短时记忆网络对发电量进行多步预测
(1)以上一单元的输出ht-1和本单元的输入xt通过sigmoid函数,为上一单元状态Ct-1中的每一项产...

【专利技术属性】
技术研发人员:沈平旭文成林王琪琪
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1