一种数据仓库技术的水务数据预测的方法及系统技术方案

技术编号:21432048 阅读:39 留言:0更新日期:2019-06-22 11:52
本发明专利技术提供一种数据仓库技术的水务数据预测的方法,通过数据仓库技术来确定水务数据的区间范围以及平均值;利用时间序列来预测水务数据,得到时间序列的预测值;通过平均值与预测值组合的方式来确定最终预测值;利用插值法计算出的缺失值来修正最终预测值。本发明专利技术优点在于:可以极大的提升数据预测的准确性,有助于辅助城市供水调度、监控小区供水管网的漏损情况。

【技术实现步骤摘要】
一种数据仓库技术的水务数据预测的方法及系统
本专利技术涉及水务领域,特别涉及一种数据仓库技术的水务数据预测的方法及系统。
技术介绍
随着智慧城市和智慧水务的发展,各水务企业都安装了大量的智能远传终端设备。在智能远传终端设备的数据采集和传输等环节,由于信号干扰、人为干扰、设备故障、环境等因素影响,再加上问题定位排查需要时间,异常问题无法及时处理等,都会影响供水调度和漏损监控的准确性。
技术实现思路
本专利技术要解决的技术问题,在于提供一种数据仓库技术的水务数据预测的方法,通过该方法可有效解决现有技术中存在的由于信号干扰、人为干扰、设备故障、环境等因素影响,再加上问题定位排查需要时间,异常问题无法及时处理等,会影响供水调度和漏损监控的准确性的问题。本专利技术是这样实现的:一种数据仓库技术的水务数据预测的方法,所述方法包括如下步骤:步骤S1、通过数据仓库技术来确定水务数据的区间范围以及平均值;步骤S2、利用时间序列来预测水务数据,得到时间序列的预测值;步骤S3、通过平均值与预测值组合的方式来确定最终预测值;步骤S4、利用插值法计算出的缺失值来修正最终预测值。进一步地,所述步骤S1具体包括:步骤S11、利用oracle数据库自带的分析函数来获取表盘读数,并利用表盘读数来计算间隔流量;步骤S12、从最新的时间点开始,往回选取一设定的第一连续时间段内的间隔流量数据,并根据选取的间隔流量数据来获得星期一至星期日中各天的数据最大值和数据最小值,从而确定出星期一至星期日中各天的水务数据的区间范围;步骤S13、从最新的时间点开始,往回选取一设定的第二连续时间段内的间隔流量数据,并计算出该第二连续时间段内的间隔流量数据的平均值;其中,所述第二连续时间段小于所述第一连续时间段。进一步地,在所述步骤S11中,在利用表盘读数来计算间隔流量时,对于时间间隔大于一天的水务数据,采用递归法来平均分摊每一天的间隔流量。进一步地,所述步骤S2具体包括:步骤S21、在SPSS软件的数据预处理中,选择线点处的线性插值法替换缺失值;步骤S22、定义日期标签和变量,将设定的第一连续时间段内每日的用水量读数作为样本开展模型训练,从而建立出时间序列模型;步骤S2、利用建立的时间序列模型来对未来的水务数据进行预测,得到时间序列的预测值。进一步地,在所述步骤S22中,所述将设定的第一连续时间段内每日的用水量读数作为样本开展模型训练具体包括如下步骤:步骤A1、在SPSS软件中根据数据的时间序列做出累计用水量序列图;步骤A2、在SPSS软件根据数据的时间序列做出每日用水量序列图;步骤A3、SPSS软件根据做出的累计用水量序列图和每日用水量序列图,选择每日用水量序列图进行自相关分析;步骤A4、根据自相关分析后得到的P值、序列的自相关图以及序列的偏自相关图,通过专家建模法在指数平滑法和ARIMA算法中自动选择最优模型,同时在专家建模器中选择考虑季节性模型,从而建立出时间序列模型。进一步地,所述步骤S3具体为:判断时间序列的预测值是否处于确定出的水务数据的区间范围内,且如果是,则将时间序列的预测值作为最终预测值;如果否,则将平均值作为最终预测值。进一步地,所述步骤S4具体包括:步骤S41、在采集到真实数据后,计算缺失值上下的已知值的斜率K:K=(b2-b1)/(n+1);其中,n表示缺失数据的个数;b1表示上一次读取的表盘度数;b2表示最新读取的表盘度数;步骤S42、计算对应的缺失值a(i):a(i)=b1+K*i;其中,i表示天数;步骤S43、使用计算出的缺失值来修正最终预测值。本专利技术具有如下优点:本专利技术通过运用传统的数据分析方式,以及时间序列的方式,结合神经网络的算法,并通过组合的方式来预测异常采集的数据以及未来的数据趋势,可以极大的提升数据预测的准确性,有助于辅助城市供水调度、监控小区供水管网的漏损情况。附图说明下面参照附图结合实施例对本专利技术作进一步的说明。图1为本专利技术一种数据仓库技术的水务数据预测的方法的执行流程图。图2为本专利技术具体实施方式中做出的累计用水量序列图。图3为本专利技术具体实施方式中做出每日用水量序列图。图4为本专利技术具体实施方式中的自相关分析图。图5为本专利技术具体实施方式中的模型拟合表。图6为本专利技术具体实施方式中的模型统计量表。具体实施方式请参阅图1至图6所示,本专利技术一种数据仓库技术的水务数据预测的方法的较佳实施例,所述方法包括如下步骤:步骤S1、通过数据仓库技术来确定水务数据的区间范围以及平均值;步骤S2、利用时间序列来预测水务数据,得到时间序列的预测值;步骤S3、通过平均值与预测值组合的方式来确定最终预测值;步骤S4、利用插值法计算出的缺失值来修正最终预测值。在本专利技术中,所述步骤S1具体包括:步骤S11、利用oracle数据库自带的分析函数来获取表盘读数,并利用表盘读数来计算间隔流量;步骤S12、从最新的时间点开始,往回选取一设定的第一连续时间段内的间隔流量数据,并根据选取的间隔流量数据来获得星期一至星期日中各天的数据最大值和数据最小值,从而确定出星期一至星期日中各天的水务数据的区间范围;在具体实施时,例如可以选取最近3个月的间隔流量数据,并从这些间隔流量数据中取出所有星期一的间隔流量数据,接着从所有星期一的间隔流量数据中获取数据最大值和数据最小值,这样就可以确定出星期一的水务数据的区间范围,例如获取的数据最大值为1,数据最小值为0.3,那么,确定出的星期一的水务数据的区间范围就是[0.3,1];同理,还需要确定出星期二、星期三、星期四、星期五、星期六以及星期日的水务数据的区间范围。步骤S13、从最新的时间点开始,往回选取一设定的第二连续时间段内的间隔流量数据,并计算出该第二连续时间段内的间隔流量数据的平均值;在具体实施时,例如可以选取最近一个月的间隔流量数据,并计算出最近一个月的间隔流量数据的平均值;其中,所述第二连续时间段小于所述第一连续时间段。在所述步骤S11中,在利用表盘读数来计算间隔流量时,对于时间间隔大于一天的水务数据,采用递归法来平均分摊每一天的间隔流量。例如,在某月1号采集到的表盘读数为45,4号采集到的表盘读数为54,那么,在1号到4号之间,每一天的间隔流量就是(54-45)/3=3。在本专利技术中,所述步骤S2具体包括:步骤S21、在SPSS软件的数据预处理中,选择线点处的线性插值法替换缺失值;由于用水量读数是呈不规律的线性上升趋势,因而选择线点处的线性插值法替换缺失值;步骤S22、定义日期标签和变量,将设定的第一连续时间段内(如最近3个月内)每日的用水量读数作为样本开展模型训练,从而建立出时间序列模型;在该步骤S22,由于数据是根据时间点的顺序进行排列的,在进行分析之前,SPSS软件需要知道序列的时间定义,然后才能够进行时间特征分析,因此,我们需要先定义日期标签和变量;步骤S2、利用建立的时间序列模型来对未来的水务数据进行预测,得到时间序列的预测值。在所述步骤S22中,所述将设定的第一连续时间段内每日的用水量读数作为样本开展模型训练具体包括如下步骤:步骤A1、在SPSS软件中根据数据的时间序列做出累计用水量序列图;如图2所示的累计用水量序列图,变量为“RED_NUM_1”,即读水量;时间轴标签为“DATE–”;步骤A2、在SPSS本文档来自技高网...

【技术保护点】
1.一种数据仓库技术的水务数据预测的方法,其特征在于:所述方法包括如下步骤:步骤S1、通过数据仓库技术来确定水务数据的区间范围以及平均值;步骤S2、利用时间序列来预测水务数据,得到时间序列的预测值;步骤S3、通过平均值与预测值组合的方式来确定最终预测值;步骤S4、利用插值法计算出的缺失值来修正最终预测值。

【技术特征摘要】
1.一种数据仓库技术的水务数据预测的方法,其特征在于:所述方法包括如下步骤:步骤S1、通过数据仓库技术来确定水务数据的区间范围以及平均值;步骤S2、利用时间序列来预测水务数据,得到时间序列的预测值;步骤S3、通过平均值与预测值组合的方式来确定最终预测值;步骤S4、利用插值法计算出的缺失值来修正最终预测值。2.根据权利要求1所述的一种数据仓库技术的水务数据预测的方法,其特征在于:所述步骤S1具体包括:步骤S11、利用oracle数据库自带的分析函数来获取表盘读数,并利用表盘读数来计算间隔流量;步骤S12、从最新的时间点开始,往回选取一设定的第一连续时间段内的间隔流量数据,并根据选取的间隔流量数据来获得星期一至星期日中各天的数据最大值和数据最小值,从而确定出星期一至星期日中各天的水务数据的区间范围;步骤S13、从最新的时间点开始,往回选取一设定的第二连续时间段内的间隔流量数据,并计算出该第二连续时间段内的间隔流量数据的平均值;其中,所述第二连续时间段小于所述第一连续时间段。3.根据权利要求2所述的一种数据仓库技术的水务数据预测的方法,其特征在于:在所述步骤S11中,在利用表盘读数来计算间隔流量时,对于时间间隔大于一天的水务数据,采用递归法来平均分摊每一天的间隔流量。4.根据权利要求2所述的一种数据仓库技术的水务数据预测的方法,其特征在于:所述步骤S2具体包括:步骤S21、在SPSS软件的数据预处理中,选择线点处的线性插值法替换缺失值;步骤S22、定义日期标签和变量,将设定的第一连续时间段内每日的用水量读数作为样本开展模型训练,从而...

【专利技术属性】
技术研发人员:李贵生孙家国刘进郑小建陈兆昌吴宇静朱祖斌余新引詹振张小霖鲍恩良陈成湖吴垠周宇荔王远媛代艳
申请(专利权)人:智恒科技股份有限公司
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1