一种基于相关分析的BP神经网络用水量预测方法技术

技术编号:19344111 阅读:18 留言:0更新日期:2018-11-07 14:37
本发明专利技术公开了一种基于相关分析的BP神经网络居民社区日用水量预测方法,首先利用相关分析理论对用水量影响因素进行分析,按影响大小进行排序,接着用偏自相关理论对日用水量序列进行分析,找出日用水量时间序列内部存在的相关关系,确定最优延迟时间,进而确定输入变量,建立了基于相关分析的BP神经网络社区用水量预测模型。对模型进行训练时,使用打乱日用水量按照时间先后顺序排列而形成的数据序列作为训练集,突破时间序列的限制,消除时间因素的影响,提高了预测方法的泛化能力。

A BP neural network water consumption prediction method based on correlation analysis

The invention discloses a BP neural network forecasting method for daily water consumption of residential communities based on correlation analysis. Firstly, the influencing factors of daily water consumption are analyzed by correlation analysis theory, and the influencing factors are sorted according to the magnitude. Then, the daily water consumption sequence is analyzed by partial autocorrelation theory, and the internal storage of daily water consumption time series is found. In the correlation, the optimal delay time is determined, and then the input variables are determined. A BP neural network community water consumption prediction model based on correlation analysis is established. When the model is trained, the data sequence formed by disrupting the daily water consumption in time sequence is used as training set, which breaks through the limitation of time series, eliminates the influence of time factors and improves the generalization ability of prediction methods.

【技术实现步骤摘要】
一种基于相关分析的BP神经网络用水量预测方法
本专利技术涉及一种基于相关分析的反向传播(BP,BackPropagation)神经网络居民社区日用水量预测方法,属于水资源管理

技术介绍
水资源是人类社会进步发展的不可替代的重要自然资源,生命之源泉。城市发展中工业、农业、生活无时无刻不在用水,用水量逐年增加,而水污染日益严重。据统计,在我国600多座建制市中,有近400座城市缺水,其中缺水严重的城市达130多个,全国城市每年缺水60亿立方米,日缺水量已超过1600万立方米。缺水给城市工业产值造成的损失在1200亿元以上,且呈增长之势。水的短缺已经成为当前经济社会发展的重要制约因素。社区用水是城市水资源消耗的重要组成部分,合理的社区用水预测是区域水资源配置、水资源有效管理和节约水资源的重要基础。针对这一问题,现有的技术方案是:严旭等人在文章《基于遗传算法的BP神经网络在城市用水量预测中的应用》中,将预测时间点的临近时刻用水量和前3天同段时间内的用水量等15个变量选作输入变量,带入预测模型对城市时用水量进行预测;储诚山等人在文章《基于遗传算法和BP神经网络的用水量预测》中,将预测日的最高温度、最低温度、平均温度、气候类型和预测日前1天的最高温度、最低温度、平均温度、气候类型、日用水量等9个变量作为输入变量,输入预测模型,对城市日用水量进行预测;周艳春等人在文章《基于BP神经网络工具箱的城市短期用水量预测》中,将前两天和前一天的天气状况、日最高温度等16项作为输入数据,带入模型预测某天t时刻的用水量。
技术实现思路
经分析,发现现有技术存在如下缺点:1)输入变量太多,容易使模型过度拟合,影响预测精度;2)输入数据复杂,模型计算量大;3)对输入变量的选择是根据历史用水变化规律,依靠技术人员主观经验,缺乏理论依据,影响预测结果的准确性;4)在进行用水量预测模型建立时严格按照时间序列进行,对数据要求严格,泛化能力差。基于此,本专利技术提出在BP神经网络的基础上进行改进,建立了基于相关分析的BP神经网络社区用水量预测模型。首先利用相关分析理论对用水量影响因素进行分析,按影响大小进行排序,接着用偏自相关理论对日用水量序列进行分析,确定最优延迟时间,进而确定输入变量,对模型进行训练时,随机打乱训练集的数据顺序,提高泛化能力。本专利技术采用下述的技术方案:一种基于相关分析的BP神经网络居民社区日用水量预测方法,该网络为三层BP网络,包括n个输入层神经元,p个隐含层神经元和1个输出层神经元,该方法包括如下步骤:首先对样本数据进行相关分析,确定输入变量;然后利用打破严格时间序列的训练集确定预测模型的参数以确定预测模型;最后,利用该BP神经网络预测模型进行预测,输出结果。具体地,打破严格时间序列是指打乱训练集按照时间先后顺序排列而形成的数据序列,突破时间序列的限制,消除时间因素的影响。确定预测模型包括:(1)参数初始化;(2)输入训练集数据,计算各层输出;(3)计算输出层误差;(4)判断是否达到误差精度,(5)如果没有达到误差精度,则根据输出层误差调整各层权值和阈值,返回步骤(2);(6)若达到误差精度,则确定BP神经网络预测模型。进一步地,相关分析包括判定天气状况、节假日等各影响因素对居民社区用水量的影响,利用相关系数检验法进行相关分析,根据相关分析理论计算居民日用水量Y与影响因素X之间的相关系数r:其中xi和yi分别为影响因素X和居民社区用水量Y第i天的数值,和分别为X和Y的均值,i=1,2,…n。确定输入变量包括用偏相关分析理论计算偏自相关系数度量居民社区日用水量时间序列内部存在的相关关系。用水量样本集为Y(t)=y1,y2,y3,…,yn,其偏自相关系数为式中,k为延迟时间,即时间间隔,k=1,2,…,m;为均值;rk为偏自相关系数。确定rk第一次过零点时所对应的k值为最优延迟时间;对于当延迟时间很大时rk才趋近于零的情况,最佳延迟时间取rk第一次小于时所对应的k值。设隐含层第j个神经元的阈值为θj,则隐含层第j个神经元的输入为式中,Wij是第i个输入神经元与第j个隐含层神经元的连接权值;zi为输入变量输入时第i个神经元的输入值;隐含层第j个神经元的输出为bj=f(sj),j=1,2…,p,f为激励函数,其形式为:日用水量输出层神经元的阈值为γ,日用水量输出的神经元的输入为:式中,Vj是第j个隐含层神经元与输出神经元的连接权值;日用水量输出为Cr=f(L)。输出层误差计算为其中,为训练集样本个数,yd和分别为训练样本的实测值和预测值。本专利技术一方面可以根据理论分析,准确确定输入变量,避免模型过度拟合、计算复杂和人为主观因素影响,提高预测精度;另一方面通过使用打乱日用水量按照时间先后顺序排列而形成的数据序列作为模型建立的训练集,突破时间序列的限制,消除时间因素的影响,提高了模型泛化能力。附图说明图1所示为三层BP神经网络拓扑结构示意图;图2所示为模型预测的流程图;图3所示为日用水量偏自相关图;图4示出了BP神经网络预测值与实测值的对比;图5示出了不同BP神经网络模型预测值与实测值的对比;图6示出了建立的BP神经网络模型与LSSVM模型预测结果的对比;以及图7示出了不同模型相对误差结果的对比。具体实施方式在居民社区日用水量预测中,输入的影响因素选择过少,会影响预测结果的准确性;输入的影响因素过多,在增加计算复杂度的同时可能陷入局部最优。为了获得较好的预测结果,合理选择影响因素,确定输入变量,至关重要。1.1日用水量影响因素相关分析为了判定天气状况、节假日等各影响因素对居民社区用水量的影响,利用相关系数检验法进行相关分析。要检验居民日用水量Y与影响因素X之间的相关关系是否显著,就是考察相关系数r的大小。根据相关分析理论,X与Y的相关系数r的计算公式如下:(1)式中:xi和yi分别为影响因素X和居民社区用水量Y第i天的数值,和分别为X和Y的均值,i=1,2,…n。当r>0时,称Y与X为正相关;当r<0时,称Y与X为负相关。若相关系数r的绝对值很小(接近于0)时,则表明Y与X之间的相关关系不显著。当相关系数r的绝对值较大(接近于1)时,才表明Y与X之间相关关系显著。1.2日用水量偏自相关分析在其它影响因素恒定不变的情况下,用偏相关分析理论研究居民社区日用水量时间序列内部存在的相关关系,真实反映用水量内部间的相关程度。偏自相关系数是度量偏自相关程度的指标。用水量样本集为Y(t)=y1,y2,y3,…,yn,则其偏自相关系数为(2)式中:k为延迟时间,即时间间隔,k=1,2,…,m;为均值;rk为偏自相关系数,其取值范围为[-1,1]。一般确定最优延迟时间的方法有两种:①rk第一次过零点时所对应的k值;②对于当延迟时间很大时rk才趋近于零的情况,最佳延迟时间可取rk第一次小于时所对应的k值。1.3BP神经网络日用水量预测模型BP神经网络是一种有隐含层的多层前馈网络。它的基本原理是梯度最速下降法,它的中心思想是调整权值使网络总误差最小,也就是采用梯度搜索技术,以期使网络的实际输出值和期望输出值的误差均方值为最小。网络学习过程是一种误差边向后传播边修正权系数的过程。三层BP网络拓扑结构示意图如图1所示,包本文档来自技高网...

【技术保护点】
1.一种基于相关分析的反向传播(BP,Back Propagation)神经网络居民社区日用水量预测方法,所述BP神经网络为三层BP网络,包括n个输入层神经元,p个隐含层神经元和1个输出层神经元,该方法包括如下步骤:首先对样本数据进行相关分析,确定输入变量;然后利用打破严格时间序列的训练集确定预测模型的参数以确定预测模型;最后,利用该BP神经网络预测模型进行预测,输出结果。

【技术特征摘要】
1.一种基于相关分析的反向传播(BP,BackPropagation)神经网络居民社区日用水量预测方法,所述BP神经网络为三层BP网络,包括n个输入层神经元,p个隐含层神经元和1个输出层神经元,该方法包括如下步骤:首先对样本数据进行相关分析,确定输入变量;然后利用打破严格时间序列的训练集确定预测模型的参数以确定预测模型;最后,利用该BP神经网络预测模型进行预测,输出结果。2.根据权利要求1所述的方法,所述打破严格时间序列是指打乱训练集按照时间先后顺序排列而形成的数据序列,突破时间序列的限制,消除时间因素的影响。3.根据权利要求2所述的方法,其中确定预测模型包括:(1)参数初始化;(2)输入训练集数据,计算各层输出;(3)计算输出层误差;(4)判断是否达到误差精度,(5)如果没有达到误差精度,则根据输出层误差调整各层权值和阈值,返回步骤(2);(6)若达到误差精度,则确定BP神经网络预测模型。4.根据权利要求3所述的方法,所述相关分析包括判定天气状况、节假日等各影响因素对居民社区用水量的影响,利用相关系数检验法进行相关分析。5.根据权利要求4所述的方法,所述相关分析包括根据相关分析理论计算居民日用水量Y与影响因素X之间的相关系数r:其中xi和yi分别为影响因素X和居民社区用...

【专利技术属性】
技术研发人员:刘心刘龙龙李文竹
申请(专利权)人:河北工程大学
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1