一种基于ARIMA模型的工业污水进水量预测的方法技术

技术编号:19009668 阅读:180 留言:0更新日期:2018-09-22 09:28
本发明专利技术公开了一种基于ARIMA模型的工业污水进水量预测的方法,包括下述步骤:对初始的时序数据进行分析以满足ARIMA模型建立的要求;对异常数据的剔除和填补等预处理;采用滑动平均滤波去除数据噪音;利用单位根检验方法ADF检验时序的平稳性;通过自相关系数分析验证非随机性;进行ARIMA(p,d,q)模型自回归和移动平均阶次的初步判定,然后结合AIC信息准则对模型定阶;利用最小二乘法优化模型参数;最后进行残差检验和模拟结果的评价,确定最终预测模型。采集的污水进水量数据已确定,利用得到的预测模型进行测试数据的预测,模型的输出则是污水进水量的预测结果。本发明专利技术的方法,模型简洁,预测模型拟合效果很好,精度高。

A prediction method of industrial sewage intake volume based on ARIMA model

The invention discloses a method for predicting industrial sewage inflow based on ARIMA model, which comprises the following steps: analyzing initial sequence data to meet the requirements of ARIMA model establishment; removing and filling abnormal data; removing data noise by moving average filter; and using unit root test method A. DF tests the stability of the time series; verifies the non-randomness by the analysis of autocorrelation coefficient; makes a preliminary determination of the autoregressive and moving average order of ARIMA (p, d, q) model, then determines the order of the model with AIC information criterion; optimizes the model parameters with the least square method; finally carries on the residual test and the evaluation of the simulation results, determines the final result. Prediction model. The collected sewage inflow data have been determined, and the prediction model is used to predict the test data. The output of the model is the prediction result of the sewage inflow. The method of the invention is simple, and the prediction model has good fitting effect and high precision.

【技术实现步骤摘要】
一种基于ARIMA模型的工业污水进水量预测的方法
本专利技术涉及污水处理厂的污水进水量预测的
,特别涉及一种基于ARIMA模型的工业污水进水量预测的方法。
技术介绍
随着工业化程度的不断提高以及人口的增加,工业污水排放量迅速增长,由此对环境造成非常巨大的影响,世界各国都投入大量的资金到工业污水处理技术的研究,开发出了许多新技术和新工艺,对改善水环境状况起到了巨大的作用。目前,各国都在大力兴建的污水处理厂是公认的解决水污染现状的一条有效途径。其要求对新建厂区的水质水量有很好的调查和预测,才能根据具体的情况和地理性质,选取合适的污水处理工艺,进行水厂的合理设计。但是,近年来国家节能减排标准和污水排放标准的不断提高,目前一些工业污水处理系统面临着较大的节能降排压力。特别是其污水的处理工艺相对较复杂,污水的处理方式主要是先进入到“厌氧—缺氧—好氧”的环节作生化处理,然后通过二沉池沉淀污泥以达到废水排放,其在第一环节会消耗大量能量,一方面源于“厌氧—缺氧—好氧”环节需要培养大量的生化菌,且曝气池包含大量动力设备,另一方面,考虑到工业废水来源大,且水量的变化比较大,其与城镇污水相比,工业污水的周期性更差,并且其进水成分更复杂,在对污水进行处理时需要随时调整,因此设计者在设计的初始阶段会对污水的处理留有很大的裕量,这就进一步造成能量的大量损失。另外,与城镇污水相比,工业污水的周期性更差,并且其进水成分更复杂,在对污水进行处理时需要随时调整,由此可见,对工业污水的进水水量进行预测,并建立相应的控制方法,是解决上述问题的有效途径之一。研究表明,工业污水的负荷与进水量成高度相关关系,因此,对污水负荷进行预测,首先要解决进水量预测的问题。而对进水量进行预测,不仅是污水处理工艺优化的研究基础,同时也关系到污水系统的合理布局、建设规模、配套管理网和截污系统等关键问题。因此,有必要展开对工业污水进水量预测的相关研究。针对这种现象,通过对处理工艺的深入研究,找出制约因素并提出相应的改造方案,节能的空间是非常大的,这是我国污水处理行业急需攻克的技术难题。有效降低污水处理系统的能耗、合理分配能源成为决定污水厂正常运行的关键因素。因此,研究和探索污水处理工艺的节能技术和途径具有非常重要的现实意义。对污水处理厂而言,进水流量及污染物浓度的变化是控制系统所要应对的扰动的主要来源。不同于其他工业生产过程,污水处理厂进水负荷一般不可调控,其突变性强,波动范围大,尤其在降雨的影响下,对生化处理系统具有较强的冲击性。
技术实现思路
本专利技术的目的在于克服现有技术中的缺点与不足,提供一种基于ARIMA模型的污水进水量预测的方法,该方法主要考虑污水进水的水量这一关联变量,基于ARIMA模型,能够有效预测工厂污水进水量。为实现以上目的,本专利技术采取如下技术方案:一种基于ARIMA模型的工业污水进水量预测的方法,包括下述步骤:S1、获取污水进水量原始时间序列数据,并进行数据质量分析,检查其原始时间序列数据中是否存在脏数据以及无法进行直接分析的数据;S2、对步骤S1分析的时间序列数据进行数据预处理,所述数据预处理包括数据清洗和数据滤波,从而得到滤波时序;S3、采用单位根检验方法检验滤波时序的平稳性;对于不符合平稳性的滤波时序,进行差分处理,得到平稳时间序列数据,并通过自相关系数图检验平稳序列的非随机性;S4、针对步骤S3得到的平稳时间序列数据,建立初步的污水进水量的ARIMA(p,d,q)模型,并根据平稳时间序列数据的自相关系数和偏自相关系数,进行ARIMA模型自回归和移动平均阶次的初步判定,然后采用AIC信息准则对ARIMA模型准确定阶;S5、对步骤S4中定阶后的ARIMA模型采用最小二乘法进行模型的参数估计,获得条件最小二乘估计值;S6、对步骤S5中完成参数估计的ARIMA模型进行有效性检验和评估,所述有效性检验是通过作残差序列自相关函数,检验该模型的残差是否为白噪声序列,若残差满足白噪声序列要求,则该模型作为最终的预测模型使用;所述评估的指标包括可决系数、AIC信息量、均方误差、平均绝对百分比误差、以及泰尔不等系数,并给出预测结果的展示和分析,最终得到确定模型适用性的结论。作为优选的技术方案,步骤S1中,所述脏数据包括缺失值、异常值以及含有特殊字符的数据;所述异常值通过利用单变量的散点图进行判断初步,然后再利用统计学的3σ法原则进行述异常值的排查。作为优选的技术方案,所述数据清洗具体为:针对单点的测量异常,采用局部数值填充,针对时段性的异常,先采用零值替换法剔除异常时间段的数值,然后利用局部平均值进行填补;所述数据滤波具体为:选取卡尔曼滤波对时间序列数据进行滤波处理。作为优选的技术方案,步骤S3具体包括下述步骤:S31、考虑时序{Yt}存在p阶自相关,p∝1,对于AR(p)模型,数学表达式:其中,{Yt}表示t时期模型观测到的时间序列,序列{et}代表t时期模型未观测到的随机干扰,表示位移项,p表示滞后阶数,η和βi表示自相关系数,ΔYt表示滞后项;单位根检验的原假设:AR(p)模型的特征方程至少含有一个单位根;单位根检验的备择假设:AR(p)模型的特征方程没有单位根;数学形式的表达式:H0:η=0H1:η≠0其中,H0表示原假设,即假设为Yt非平稳序列,H1表示备择假设,即Yt为平稳序列;在MATLAB中通过单位根检验结果来确定是否接受原假设或者备择假设,从而判断一个高阶自相关的AR(p)模型是否存在单位根,达到检验时间序列数据平稳性的目的;S32、通过自相关系数验证滤波时序的非随机性,自相关系数度量的是同一事件在两个不同时期之间的相关程度,即度量事物过去的行为对其现在的影响,具体是通过观察自相关系数图验证时间序列的非随机性;S33、若滤波时序经判断不符合平稳性,则采用差分或取对数的数据变化方法进行平稳化处理,得到平稳时间序列数据。作为优选的技术方案,步骤S33中,差分数据变化方法的具体操作如下:对不符合平稳性的数据序列{Yt}进行d次差分处理,d≤2,这里标记为{DYt},而原始时序{Yt}称为d阶单整序列,标记为Yt~I(d),即DYt=▽dYt=(1-L)dYt,L表示滞后算子,I()表示d次差分后的时序数列;符号▽表示矢量微分算符;将数据序列{DYt}转化为以下的ARIMA(p,d,q)的形式:其中,φp,θq分别是模型的自回归和移动平均部分的系数,p,q均为为时间序列的滞后阶次;序列{et}代表模型未观测到的随机干扰,即白噪声序列;然后使用滞后算子,数据序列{DYt}表示为:Φ(L)DYt=φ0+Θ(L)et其中,Θ(L)=1-θ1L-…-θqLp;然后求取数据序列的均值,得到平稳时间序列数据。作为优选的技术方案,步骤S4中,建立时间序列的初步ARIMA(p,d,q)模型表达式如下:其中,Yt-p表示平稳时间序列,φp,θq分别是ARIMA(p,d,q)模型的自回归和移动平均部分的系数,p代表预测模型中采用的时序数据本身的滞后阶次,q代表预测模型中采用的预测误差的滞后阶次;序列{et}代表ARIMA(p,d,q)模型未观测到的随机干扰,即白噪声序列;根据时序的自相关系数和偏自相关系数图表现出来的截尾性和拖尾性进行ARIMA(p,d,本文档来自技高网
...
一种基于ARIMA模型的工业污水进水量预测的方法

【技术保护点】
1.一种基于ARIMA模型的工业污水进水量预测的方法,其特征在于,包括下述步骤:S1、获取污水进水量原始时间序列数据,并进行数据质量分析,检查其原始时间序列数据中是否存在脏数据以及无法进行直接分析的数据;S2、对步骤S1分析的时间序列数据进行数据预处理,所述数据预处理包括数据清洗和数据滤波,从而得到滤波时序;S3、采用单位根检验方法检验滤波时序的平稳性;对于不符合平稳性的滤波时序,进行差分处理,得到平稳时间序列数据,并通过自相关系数图检验平稳序列的非随机性;S4、针对步骤S3得到的平稳时间序列数据,建立初步的污水进水量的ARIMA(p,d,q)模型,并根据平稳时间序列数据的自相关系数和偏自相关系数,进行ARIMA模型自回归和移动平均阶次的初步判定,然后采用AIC信息准则对ARIMA模型准确定阶;S5、对步骤S4中定阶后的ARIMA模型采用最小二乘法进行模型的参数估计,获得条件最小二乘估计值;S6、对步骤S5中完成参数估计的ARIMA模型进行有效性检验和评估,所述有效性检验是通过作残差序列自相关函数,检验该模型的残差是否为白噪声序列,若残差满足白噪声序列要求,则该模型作为最终的预测模型使用;所述评估的指标包括可决系数、AIC信息量、均方误差、平均绝对百分比误差、以及泰尔不等系数,并给出预测结果的展示和分析,最终得到确定模型适用性的结论。...

【技术特征摘要】
1.一种基于ARIMA模型的工业污水进水量预测的方法,其特征在于,包括下述步骤:S1、获取污水进水量原始时间序列数据,并进行数据质量分析,检查其原始时间序列数据中是否存在脏数据以及无法进行直接分析的数据;S2、对步骤S1分析的时间序列数据进行数据预处理,所述数据预处理包括数据清洗和数据滤波,从而得到滤波时序;S3、采用单位根检验方法检验滤波时序的平稳性;对于不符合平稳性的滤波时序,进行差分处理,得到平稳时间序列数据,并通过自相关系数图检验平稳序列的非随机性;S4、针对步骤S3得到的平稳时间序列数据,建立初步的污水进水量的ARIMA(p,d,q)模型,并根据平稳时间序列数据的自相关系数和偏自相关系数,进行ARIMA模型自回归和移动平均阶次的初步判定,然后采用AIC信息准则对ARIMA模型准确定阶;S5、对步骤S4中定阶后的ARIMA模型采用最小二乘法进行模型的参数估计,获得条件最小二乘估计值;S6、对步骤S5中完成参数估计的ARIMA模型进行有效性检验和评估,所述有效性检验是通过作残差序列自相关函数,检验该模型的残差是否为白噪声序列,若残差满足白噪声序列要求,则该模型作为最终的预测模型使用;所述评估的指标包括可决系数、AIC信息量、均方误差、平均绝对百分比误差、以及泰尔不等系数,并给出预测结果的展示和分析,最终得到确定模型适用性的结论。2.根据权利要求1所述的基于ARIMA模型的工业污水进水量预测的方法,其特征在于,步骤S1中,所述脏数据包括缺失值、异常值以及含有特殊字符的数据;所述异常值通过利用单变量的散点图进行判断初步,然后再利用统计学的3σ法原则进行述异常值的排查。3.根据权利要求1所述的基于ARIMA模型的工业污水进水量预测的方法,其特征在于,所述数据清洗具体为:针对单点的测量异常,采用局部数值填充,针对时段性的异常,先采用零值替换法剔除异常时间段的数值,然后利用局部平均值进行填补;所述数据滤波具体为:选取卡尔曼滤波对时间序列数据进行滤波处理。4.根据权利要求1所述的基于ARIMA模型的工业污水进水量预测的方法,其特征在于,步骤S3具体包括下述步骤:S31、考虑时序{Yt}存在p阶自相关,p∝1,对于AR(p)模型,数学表达式:其中,{Yt}表示t时期模型观测到的时间序列,序列{et}代表t时期模型未观测到的随机干扰,表示位移项,p表示滞后阶数,η和βi表示自相关系数,ΔYt表示滞后项;单位根检验的原假设:AR(p)模型的特征方程至少含有一个单位根;单位根检验的备择假设:AR(p)模型的特征方程没有单位根;数学形式的表达式:H0:η=0H1:η≠0其中,H0表示原假设,即假设为Yt非平稳序列,H1表示备择假设,即Yt为平稳序列;在MATLAB中通过单位根检验结果来确定是否接受原假设或者备择假设,从而判断一个高阶自相关的AR(p)模型是否存在单位根,达到检验时间序列数据平稳性的目的;S32、通过自相关系数验证滤波时序的非随机性,自相关系数度量的是同一事件在两个不同时期之间的相关程度,即度量事物过去的行为对其现在的影响,具体是通过观察自相关系数图验证时间序列的非随机性;S33、若滤波时序经判断不符合平稳性,则采用差分或取对数的数据变化方法进行平稳化处理,得到平稳时间序列数据。5.根据权利要求4所述的基于ARIMA模型的工业污水进水量预测的方法,其特征在于,步骤S33中,差分数据变化方法的具体操作如下:对不符合平稳性的数据序列{Yt}进行d次差分处理,d≤2,这里标记为{DYt},而原始时序{Yt}称为d阶单整序列,标记为Yt~I(d),即DYt=▽dYt=...

【专利技术属性】
技术研发人员:陈新泉薛菲李继庚洪蒙纳江伦
申请(专利权)人:广东省广业科技集团有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1