一种基于向量时间序列模型的污水COD负荷预测的方法技术

技术编号:15689251 阅读:73 留言:0更新日期:2017-06-24 00:40
本发明专利技术公开了一种基于向量时间序列模型的污水COD负荷预测的方法,包括下列步骤:利用数据挖掘建模过程进行挖掘目标的定义;对获取的污水进水相关数据进行数据的探索和预处理以达到向量自回归模型建模的要求;选用最大似然估计模型的参数,同时选用信息准则确定模型的阶次,然后利用多元混成统计进行模型检验;进一步通过目标参数来简化模型,从而建立简洁有效的预测模型。所述采集的进水数据已确定进水量和进水COD,同时构造了污水COD负荷这一属性;利用得到的预测模型进行测试数据的预测,模型的输出则是污水COD负荷相关变量的预测结果。本发明专利技术的方法,模型简洁而且可以同时预测多个变量,预测精度比较高同时所需要的时间短。

A method for forecasting COD load of wastewater based on vector time series model

The invention discloses a method for sewage COD load vector time series prediction model based on the definition, includes the following steps: using data mining modeling process of mining target; the sewage related data exploration and data preprocessing to achieve vector autoregressive model modeling requirements; selection of model parameter estimation maximum the order of likelihood, and the criterion of the model, and then using multivariate statistics hybrid model test; further through target parameters to simplify the model, so as to establish a prediction model for simple and effective. The collected data has been determined the water inflow and water COD, and constructed the COD sewage load attribute; forecast test data using the prediction model, the output of the model is the prediction results of COD sewage load variables. The method of the invention is simple in model and can predict multiple variables at the same time, the prediction accuracy is relatively high, and the required time is short.

【技术实现步骤摘要】
一种基于向量时间序列模型的污水COD负荷预测的方法
本专利技术涉及污水处理厂进水的污水负荷预测的
,具体涉及一种基于向量时间序列模型的污水COD负荷预测的方法。
技术介绍
随着工业化程度的不断提高和人口的增长,城市污水排放量迅速增长,对环境的影响非常巨大,世界各国都投入大量的资金用于城市污水处理技术的研究,开发出了许多新技术和新工艺,对改善水环境状况起了巨大的作用。目前,建造污水处理厂是公认的解决水污染现状的一条有效途径,各国都在大力兴建。但污水处理是一项能量密集型的综合技术,随着污水厂的大规模兴建,污染物的排放得到一定程度的控制,但是随之问题也浮现出来——污水处理设施的高投资、高运行成本在一定程度上阻碍了污水处理事业的发展,许多中小型城市由于资金问题没有修建污水处理厂,已建成的一些污水厂也因运行成本过高处于停产和半停产状态。纵观影响城市污水处理厂建设发展的因素,能耗问题是最主要的影响因素,如果不能及时有效的解决,污水处理的发展会受到很大的阻碍。我国相比于国外同种工艺类型的城市污水处理厂,能耗普遍偏高而且出水水质和污泥处理均达不到发达国家的处理水平。清华大学的钱易教授曾指出传统活性污泥法流程复杂、基建费用高、运行中需要很大的能源消耗、运行费用很可观,我国经济实力和发达国家相比较弱,不应该直接照搬发达国家的经验和技术来解决自己城市污水处理问题。针对这种现象,通过对处理工艺的深入研究,找出制约因素并提出相应的改造方案,节能的空间是非常大的,这是我国污水处理行业急需攻克的技术难题。有效降低污水处理系统的能耗、合理分配能源成为决定污水厂正常运行的关键因素。因此,研究和探索污水处理工艺的节能技术和途径具有非常重要的现实意义。同时,污水的实际处理量与能耗的关系非常密切,随着污水处理量的增加,能耗也随之增加,但是能耗增幅的大小和该污水处理厂的设备的实际运行状况有着非常大的关系。随着污水处理量的不断增长以及出水排放标准的日趋严格,如何充分应对污水处理厂进水负荷和运行环境的变化,实现污染物的稳定达标并降低运行成本,成为污水处理运行管理所要面对的关键问题。自上世纪70年代以来,依赖于监测设备(硬件)及控制算法(软件)的发展,污水处理仪表、控制和自动化技术(InstrumentationControlandAutomation,ICA)在污水处理厂日常运行中发挥着越来越重要的作用。研究及实践表明,根据工艺的运行原理及特点,提高污水处理系统ICA技术的应用程度是加强污水处理厂脱氮除磷效果,实现节能降耗目标的有效手段。对污水处理厂而言,进水流量及污染物浓度的变化是控制系统所要应对的扰动的主要来源。不同于其他工业生产过程,污水处理厂进水负荷一般不可调控,其突变性强,波动范围大,尤其在降雨的影响下,对生化处理系统具有较强的冲击性。国内现有的污水处理中的相关模型技术,主要集中在污水处理后的水质COD、BOD等的预测和软测量中,而忽略了进水的重要性。实际上,对于污水处理的控制系统而言,出水的污染物浓度达到国家许可的排放标准是基本目标,进水的污染物负荷对于控制系统而言则是主要考虑的输入影响因素。
技术实现思路
本专利技术的目的是为了解决现有技术中的上述缺陷,提供一种基于向量时间序列模型的污水COD负荷预测的方法,该方法考虑污水进水的水量、水质COD等关联变量。本专利技术的目的可以通过采取如下技术方案达到:一种基于向量时间序列模型的污水COD负荷预测的方法,包括下列步骤:S1、基于数据建模目标的变量选取:利用控制系统采集得到的污水处理厂进水的变量进行分析,所述变量包括进水量、污水COD、NH4N、PH和进水温度T,通过定性分析采集变量与污水COD负荷的关联和影响程度,选取出对污染物负荷有影响的变量;S2、对选取变量进行数据探索:对于步骤S1中选取的对污水COD负荷相关的变量进行数据结构的分析,包括:数据质量分析和数据特征分析;S3、对探索后的数据进行数据预处理,达到向量自回归建模的要求:通过对步骤S2分析的数据进行数据序列的清洗、滤波数据的集成、数据的变换和新属性的构造、数据属性的规约、数据序列的平稳化和零均值化的处理,通过对建模变量的筛选进行数据的规约,进行规约筛选确定选取进水量、进水COD和污水COD负荷为模型的变量;S4、针对满足建模要求的数据建立污水COD负荷的预测模型并进行模型的检验:利用经过数据预处理达到建模要求的数据采用向量时间序列建立污水COD负荷的VAR预测模型,并通过采用AIC信息准则对模型定阶,进而建立污水COD负荷的VAR预测模型,然后利用多元混成统计进行模型的有效性检验;S5、对建立的污水COD负荷的预测模型简化并优化模型的参数:通过目标参数简化得到简化模型,同样采用最大似然估计得到模型的参数得到优化模型;S6、利用准备的数据测试优化模型,通过分析预测结果进行模型的评价:将规约好的进水数据作为污水COD负荷的预测模型的输入,得到进水量、进水COD和污水COD负荷的预测结果,进行结果的分析并给出模型的相关评价。进一步地,所述数据质量分析用于检查原始数据中是否存在脏数据以及无法进行直接分析的数据,所述脏数据包括缺失值、异常值以及含有特殊字符的数据;所述数据特征分析通过绘制图表、计算指定特征量进行变量的分布分析来发现数据的分布特征和分布类型,通过统计量分析进行数据的统计描述,以及周期性分析。进一步地,利用单变量的散点图和箱形图初步进行所述异常值的判断,同时也利用统计学的3σ法原则进行所述异常值的排查。进一步地,所述数据序列的清洗具体为:针对所述脏数据的处理中少量数据的缺失采用单序列的局部回归拟合插值,针对所述脏数据的处理中时间段数据的缺失采用所采集的数据当前时间点的均值填补,针对所述脏数据的处理中含有特殊字符的数据变换为常数值,针对所述脏数据的处理中异常值采用全局均值进行替换;所述滤波数据的集成具体为:选取卡尔曼滤波对数据序列进行滤波处理,接着将所述步骤S1中选取出对污染物负荷有影响的变量集成为一张数据变量表;所述数据的变换和新属性的构造具体为:采用滤波后的进水量和污水COD的乘积得到污水COD负荷这个新属性,新属性的构造计算如下:污水COD负荷=单位时间进水量x进水COD(1);所述数据属性的规约具体为:通过对集成的数据进行变量的相关性分析,选取对污水COD负荷影响明显的变量进行属性的规约,剔除对污水COD负荷影响不显著的属性,最后确定模型采用的数据是进水量、进水COD和污水COD负荷,其中,相关性分析中采用皮尔逊相关系数:式中,cov(X,Y)表示两个边路间的互协方差,σX,σY则分别代表自协方差,E代表的是各个变量的期望;所述数据序列的平稳化和零均值化处理具体为:首先,采用单位根检验法判断序列的平稳性:考虑k维VAR(p)模型,假定表达式为:式中,是一个p次矩阵多项式,其中,φ0是一个k维常数向量,并且对于i>0,φi是kxk维矩阵且φi≠0,Ιk是kxk维的单位矩阵,Βi是i阶次的后移算子,at是独立同分布随机向量序列,其均值为0,协方差矩阵∑a为正定矩阵,假定序列是平稳的,求期望有:(Ιk-φ1-…-φp)μ=[φ(1)]μ=φ0(4)其中,μ=Ε(zt),因此有μ=[φ(1)]-1φ0,则有|Ιk-φΒ本文档来自技高网
...
一种基于向量时间序列模型的污水COD负荷预测的方法

【技术保护点】
一种基于向量时间序列模型的污水COD负荷预测的方法,其特征在于,包括下列步骤:S1、基于数据建模目标的变量选取:利用控制系统采集得到的污水处理厂进水的变量进行分析,所述变量包括进水量、污水COD、NH

【技术特征摘要】
1.一种基于向量时间序列模型的污水COD负荷预测的方法,其特征在于,包括下列步骤:S1、基于数据建模目标的变量选取:利用控制系统采集得到的污水处理厂进水的变量进行分析,所述变量包括进水量、污水COD、NH4N、PH和进水温度T,通过定性分析采集变量与污水COD负荷的关联和影响程度,选取出对污染物负荷有影响的变量;S2、对选取变量进行数据探索:对于步骤S1中选取的对污水COD负荷相关的变量进行数据结构的分析,包括:数据质量分析和数据特征分析;S3、对探索后的数据进行数据预处理,达到向量自回归建模的要求:通过对步骤S2分析的数据进行数据序列的清洗、滤波数据的集成、数据的变换和新属性的构造、数据属性的规约、数据序列的平稳化和零均值化的处理,通过对建模变量的筛选进行数据的规约,进行规约筛选确定选取进水量、进水COD和污水COD负荷为模型的变量;S4、针对满足建模要求的数据建立污水COD负荷的预测模型并进行模型的检验:利用经过数据预处理达到建模要求的数据采用向量时间序列建立污水COD负荷的VAR预测模型,并通过采用AIC信息准则对模型定阶,进而建立污水COD负荷的VAR预测模型,然后利用多元混成统计进行模型的有效性检验;S5、对建立的污水COD负荷的预测模型简化并优化模型的参数:通过目标参数简化得到简化模型,同样采用最大似然估计得到模型的参数得到优化模型;S6、利用准备的数据测试优化模型,通过分析预测结果进行模型的评价:将规约好的进水数据作为污水COD负荷的预测模型的输入,得到进水量、进水COD和污水COD负荷的预测结果,进行结果的分析并给出模型的相关评价。2.根据权利要求1所述的一种基于向量时间序列模型的污水COD负荷预测的方法,其特征在于,所述数据质量分析用于检查原始数据中是否存在脏数据以及无法进行直接分析的数据,所述脏数据包括缺失值、异常值以及含有特殊字符的数据;所述数据特征分析通过绘制图表、计算指定特征量进行变量的分布分析来发现数据的分布特征和分布类型,通过统计量分析进行数据的统计描述,以及周期性分析。3.根据权利要求2所述的一种基于向量时间序列模型的污水COD负荷预测的方法,其特征在于,利用单变量的散点图和箱形图初步进行所述异常值的判断,同时也利用统计学的3σ法原则进行所述异常值的排查。4.根据权利要求2所述的一种基于向量时间序列模型的污水COD负荷预测的方法,其特征在于,所述数据序列的清洗具体为:针对所述脏数据的处理中少量数据的缺失采用单序列的局部回归拟合插值,针对所述脏数据的处理中时间段数据的缺失采用所采集的数据当前时间点的均值填补,针对所述脏数据的处理中含有特殊字符的数据变换为常数值,针对所述脏数据的处理中异常值采用全局均值进行替换;所述滤波数据的集成具体为:选取卡尔曼滤波对数据序列进行滤波处理,接着将所述步骤S1中选取出对污染物负荷有影响的变量集成为一张数据变量表;所述数据的变换和新属性的构造具体为:采用滤波后的进水量和污水COD的乘积得到污水COD负荷这个新属性,新属性的构造计算如下:污水COD负荷=单位时间进水量x进水COD(1);所述数据属性的规约具体为:通过对集成的数据进行变量的相关性分析,选取对污水COD负荷影响明显的变量进行...

【专利技术属性】
技术研发人员:李继庚蔡威满奕曾志强刘焕彬
申请(专利权)人:华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1