一种基于宽度学习网络的自来水厂的出水余氯预测方法技术

技术编号:34804951 阅读:14 留言:0更新日期:2022-09-03 20:12
本发明专利技术公开了一种基于宽度学习网络的自来水厂的出水余氯预测方法,包括以下步骤:首先对自来水厂的数据集进行标准化预处理,然后对标准化处理后的自来水厂数据集的辅助变量利用主成分分析方法(PCA)方法得到其低维的特征映射,再通过将辅助变量的低维特征映射作为输入、目标变量作为输出,最后使用求伪逆的方法训练宽度学习网络模型,得到自来水厂出水余氯预测模型。本发明专利技术克服了观测数据存在的非线性、时变性、干扰性问题,为自来水厂日常的运行决策提供了技术参考。决策提供了技术参考。决策提供了技术参考。

【技术实现步骤摘要】
一种基于宽度学习网络的自来水厂的出水余氯预测方法


[0001]本专利技术涉及一种自来水厂关键水质参数预测方法,特别是涉及一种基于宽度学习网络的自来水厂的出水余氯预测方法。

技术介绍

[0002]水是生命之源,城市供水是保障区域经济发展、人民生活水平的重要基础设施。供水行业管理的能力直接反映在供水质量上,并且影响着整个国民生产水平、人民生活质量和供水企业的经济效益。一直以来,我国供水行业传统的计测手段、落后的制水控制和管理水平束缚了供水企业合理、安全、经济的运行,随着社会对供水质量和安全可靠性要求的不断提高,利用先进高效的设备、加药手段和方法,实现生产工艺自动化,加强水处理各个工艺环节的自动监测和自动控制对于现代化水厂的建设显得意义重大,而在自来水厂现代化建设的过程中,对于自来水厂关键水质参数进行快速准确的预测,则对自来水厂日常的运行决策提供重要的依据和建议,这对推动现代化自来水厂的建设尤为重要。
[0003]目前,对于自来水厂关键水质参数的预测模型建模方法上,传统机理模型大多使用机器学习方法,如支持向量机、线性回归模型等,传统机理模型依托于真实的工艺过程,可以从本质上很好的反映目标变量与输入变量之间的关系,但现实生活中的工艺过程,往往存在一些容易被忽略的工艺细节,这就使得传统的机理模型不能完全反映输入输出之间的关系。
[0004]因此,如何进行自来水厂关键水质参数的预测建模,是本领域需要解决的技术难题。

技术实现思路

[0005]专利技术目的:本专利技术要解决的技术问题是提供一种基于宽度学习的自来水厂关键水质参数预测的方法,在现有自来水厂观测数据存在非线性、时变性、干扰性问题的情况下,解决了自来水厂出水余氯参数不能准确预测的问题,实现自来水厂出水余氯的准确实时预测,为自来水厂日常运行操作中的决策提供技术参考。
[0006]技术方案:本专利技术所述的基于宽度学习网络的自来水厂出水余氯预测,包括以下步骤:
[0007](1)对自来水厂数据集X(J
×
K)进行数据标准化预处理,其中,J为自来水厂各传感器输出的观测变量的样本个数,K为自来水厂的观测数据的变量个数;
[0008](2)根据步骤(1)的数据预处理结果,将预处理后的自来水厂数据经过主成分分析(PCA)处理,得到的观测变量个数由K个减少为F个,得到代表自来水厂数据集的二维矩阵X(J
×
F);
[0009](3)将步骤(2)中所述的二维数据集X(J
×
F)和目标变量(出水余氯)中前80%的样本作为训练集、后20%的样本作为验证集,训练宽度学习网络模型,若验证的R2决定系数大于0.95,则保留所训练的宽度学习网络模型后结束训练,否则使用增量学习算法继续训练,
直到满足条件为止;
[0010]进一步的,步骤(2)中的数据预处理过程为:二维数据集X(J
×
F),按列对各个变量进行标准化处理,从而消除在建模过程中各变量间的量纲影响,建立均值方差标准化是一种将数据转化为标准正态分布的标准化方法,如下:
[0011][0012]其中,x为自来水厂单个数据的取值,μ为变量对应列的均值,σ为变量对应列的标准差;
[0013]进一步的,步骤(2)中对预处理过后的数据进行的主成分分析方法为:
[0014]PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。
[0015](1)自来水厂标准化后数据集为二维矩阵X(J
×
K),将数据按列组成K行J列的矩阵U,其中J为样本个数,K为辅助变量个数;
[0016](2)将U的每一行(代表一个属性)进行零均值化,即减去这一行的均值;
[0017](3)求出协方差矩阵
[0018](4)求出协方差矩阵的特征值及对应的特征向量;
[0019](5)将特征向量按对应特征值大小从上到下按行排列成矩阵,取前F行组成矩阵P;Y=PU即为降维到F维后的数据。
[0020]进一步的,步骤(3)中训练宽度学习网络模型的方法为:
[0021]宽度学习网络结构共有四层:输入层,特征层,增强层与输出层;构建基于宽度学习网络的预测模型共分为四步:将变量处理并输入网络,构建宽度学习中的特征层,构建增强层,将特征层和增强层的输出融合成为输出层的输入,根据输出层的输入和目标变量求取其对应的伪逆;确定用于预测出水余氯的宽度学习网络各批次神经元个数为K,特征神经元组数为N,N为整数,N∈[5,30],增强神经元组数为M,M为整数,M∈[5,30],输出神经元个数为1,使用训练样本训练宽度学习网络;选取的经过PCA处理得到的6个变量作为网络输入可以表示为:
[0022]X(t)=[X1(t),X2(t),X3(t),X4(t),X5(t),X6(t)],t=1,2,...,Q
[0023]其中,Q为样本数;输入层:输入层由6个神经元组成,每一个输入神经元的输出可以表示为:
[0024]U
e
(t)=X
e
(t),e=1,2,3,...,6
[0025]其中,X
e
(t)为输入层第e个神经元的输入值,U
e
(t)为输入层第e个神经元的输出值。
[0026]特征层:特征层由N组神经元组成,第i组特征神经元的输出可以表示为:
[0027]Z
i
(t)=φ
i
(XW
ei

ei
),i=1,2,...,N
[0028]其中,W
ei
是第e个输入神经元与第i组特征神经元之间的权重,β
ei
为第e个输入神经元与第i组特征神经元之间的偏差项,φ为激活函数。所有特征节点组合在一起为:
[0029]Z
N
(t)≡[Z1,Z2,...,Z
N
][0030]增强层:增强层由M组神经元节点组成,第j组增强层的输出可以表示为:
[0031]H
j
(t)=ξ
j
(Z
N
W
hj

hj
),j=1,2,...,M
[0032]其中,W
hj
、β
hj
为特征层输出与第h组增强层中第j个增强节点之前的权重和偏差项,ξ
j
为激活函数;所有增强节点组可表示为:
[0033]H
M
(t)≡[H1,H2,...,H
M
][0034]宽度学习模型可以表示为:
[0035]Y=[Z1,Z2,...,Z
N
|ξ(Z
N
W
h1

h1
),...,ξ(Z
N
W
hM

hM<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于宽度学习网络的自来水厂的出水余氯预测方法,其特征在于包括以下步骤:(1)对自来水厂数据集X(J
×
K)进行数据标准化预处理,其中,J为自来水厂观测数据的样本个数,K为自来水厂的观测数据的变量个数;(2)根据步骤(1)的数据预处理结果,将预处理后的自来水厂数据经过主成分分析PCA处理,得到的观测变量个数由K个减少为F个,得到代表自来水厂数据集的二维矩阵X(J
×
F);(3)将步骤(2)中所述的二维数据集X(J
×
F)和目标变量中前80%的样本作为训练集、后20%的样本作为验证集,训练宽度学习网络模型,所述目标变量为出水余氯;若验证的R2决定系数大于0.95,则保留所训练的宽度学习网络模型后结束训练,否则使用增量学习算法继续训练,直到满足条件为止。2.根据权利要求1所述的基于宽度学习网络的自来水厂的出水余氯预测方法,其特征在于步骤(1)中的数据标准化预处理通过下式进行:其中,x为自来水厂单个数据的取值,μ为变量对应列的均值,σ为变量对应列的标准差。3.根据权利要求1所述的基于宽度学习网络的自来水厂的出水余氯预测方法,其特征在于步骤(2)中将预处理过的数据再进行PCA降维的方法提取数据的主要特征分量,实现高维数据的降维,通过线性变换将原始数据变换为一组各维度线性无关的表示。4.根据权利要求1所述的基于宽度学习网络的自来水厂的出水余氯预测方法,其特征在于步骤(3)中所述的宽度学习网络模型:宽度学习网络结构共有四层:输入层,特征层,增强层与输出层;选取的经过标准化、PCA处理后得到的6个变量作为网络输入表示为:X(t)=[X1(t),X2(t),X3(t),X4(t),X5(t),X6(t)],t=1,2,...,Q,其中,Q为样本数;输入层:输入层由6个神经元组成,每一个输入神经元的输出表示为:U
e
(t)=X
e
(t),e=1,2,3,...,6其中,X
e
(t)为输入层第e个神经元的输入值,U
e
(t)为输入层第e个神经元的输出值;特征层:特征层由N组神经元组成,第i组特征神经元的输出表示为:Z
i
(t)=φ
i
(X(t)W
ei

ei
),i=1,2,...,N其中,W
ei
是第e个输入神经元与第i组特征神经元之间的权重,β
ei
为第e个输入神经元与第i组特征神经元之间的偏差项,权重和偏差均为随机生成的;φ为激活函数;所有特征节点组合在一起为:Z
N
≡[Z1,Z2,...,Z
N
]增强层:增强层由M组神经元节点组成,第j组增强层的输出可以表示为:H
j
=ξ
j
(Z
N
W
hj

hj
),j=1,2,...,MW
hj
、β
hj
为特征层输出与第h组增强层中第j个增强节点之前的权重和偏差项,均为随机生成的且分别与W

【专利技术属性】
技术研发人员:王村松张泉灵韩凯超何文敏薄翠梅张登峰李俊
申请(专利权)人:南京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1