一种基于改进型长短期记忆LSTM神经网络的污水处理水质预测方法技术

技术编号:23854059 阅读:45 留言:0更新日期:2020-04-18 10:09
本发明专利技术公开了一种基于改进型长短期记忆LSTM神经网络的污水处理水质预测方法,包括以下步骤:1)数据处理;2)建立并训练改进型长短期记忆LSTM神经网络预测模型;3)将待预测数据导入整体改进型长短期记忆LSTM神经网络预测模型,输出得到预测水质数值。本发明专利技术先对数据源进行有效清洗及梳理,去除干扰因素及噪点并明晰数据间关系,为数据分析做好前期工作。数据分析时,改进型LSTM网络可以很好对大时滞以及强耦合类数据进行分析,可以准确的映射出长时间跨度的数值关系,为污水水质预测提供了极大的便利。

A prediction method of wastewater treatment quality based on improved long and short term memory LSTM neural network

【技术实现步骤摘要】
一种基于改进型长短期记忆LSTM神经网络的污水处理水质预测方法
本专利技术属于污水处理领域,具体涉及一种基于改进型长短期记忆LSTM神经网络的污水处理水质预测方法。
技术介绍
循环神经网络(RecurrentNeuralNetwork,RNN)是一种用于处理序列数据的神经网络。相比一般的神经网络来说,他能够处理序列变化的数据。比如某个单词的意思会因为上文提到的内容不同而有不同的含义,RNN就能够很好地解决这类问题。它的特性是不仅可以对空间维度进行操作,还能对时序维度进行操作,其自身结构特性是在隐藏层多了一步反馈操作,这种结构可使得RNN的输入内容不仅包含输入层的数据,还包含来自上一时刻隐藏层所反馈出的数据,这也是其有时序特性的主要原因。但是这种结构有一个比较致命的问题,就是伴随着自身梯度异常的问题;因为自反馈回路的应用加速了梯度消失现象的发生,而为了避免此现象,开发了长短期记忆网络(LongShortTermMemoryNetwork,LSTM)。LSTM网络能有效的解决RNN网络因自身网络缺陷而导致的梯度消失问题,即无法记录长时间内容,而LSTM网络通过增加遗忘门以及改良的输入门、更新门、输出门等结构,实现了可较长时间记录内容的特质。但是即使有这些特性还是无法使其应用在污水处理分析上,因为污水处理过程是一个大型流程工业过程,具有大时变、强耦合、大时滞以及干扰严重等特点;同时,污水处理过程生化反应复杂,运行过程中涉及到变量众多,导致其在分析数据时对大时间跨度的数据有大量记忆需求,而这时LSTM就无法满足应用需求,所以需要对LSTM神经网络进行改良调整以适应污水处理过程中数据分析的需求。
技术实现思路
针对现有污水处理工艺特性和现有污水处理水质分析方法缺陷,本专利技术旨在提供一种以神经网络分析为基础的高精度分析方法,即一种基于改进型长短期记忆LSTM神经网络的污水处理水质预测方法。为了达到上述的目的,本专利技术所采用的技术方案是:一种基于改进型长短期记忆LSTM神经网络的污水处理水质预测方法,包括以下步骤:1)数据处理:对污水处理上报数据进行预处理,接着对预处理的数据进行PCA降维,得到结果数据,然后利用决策树以及剪枝操作,选出结果数据的主要参量对应关系,建立参量映射关系表;2)建立并训练改进型长短期记忆LSTM神经网络预测模型:根据参量映射关系表确定改进型长短期记忆LSTM神经网络的输入与输出参量,建立改进型长短期记忆LSTM神经网络预测模型,并经过训练得到整体改进型长短期记忆LSTM神经网络预测模型;所述改进型长短期记忆LSTM神经网络包括输入层、前端网络并行层、LSTM网络层、后端网络串行层和输出层;3)将待预测数据导入整体改进型长短期记忆LSTM神经网络预测模型,输出得到预测水质数值。优选的,所述预处理为去除污水处理上报数据中不合理限值外数据,然后对上报数据数据进行3倍标准差处理,去除上报数据的最大值或最小值与均值的差超过3倍标准差的数据,并对整理后的数据进行整体降维操作,去除数据中的冗余信息得到结果数据。优选的,所述LSTM改进型神经网络模型中输入层为数据参量输入网络的对接接口,根据数据包含时间长度,将数据集合X分为n个部分,即:X=[x(1),x(2),...,x(n)]即将长时间跨度的一个数据分为相对短时间跨度的n个数据,并且需要注意的是当数据集时间跨度越长,网络将数据集分割的分数n值越大。优选的,所述前端网络并行层包括多组全连接神经网络和dropout层的并联形式,多组全连接神经网络中网络节点i和网络节点j之间的权值为wij,节点j的阀值为bj,每个节点的输出值为xj,而每个节点的输出值是根据上层所有节点的输出值、当前节点与上一层所有节点的权值与偏置经过激活函数f共同决定的,效果如下所示:xj=f(Sj)在全连接网络输出完成后,进入dropout网络层级结构进行处理,具体如下:上面公式中Bernoulli函数,是以概率p,随机生成一个0、1的向量。优选的,其特征在于,所述LSTM网络层是整个改进型LSTM神经网络中主要的数据处理层级,它由多个LSTM网络并联组成,其中当前输入xt和上一个状态传递下来的ct-1、ht-1共同决定,具体如下:其中,zf,zi,z0是由拼接向量乘以权重矩阵之后,再通过一个sigmoid激活函数转换成0到1之间的数值,来作为一种门控状态,而z则是将结果通过一个tanh激活函数将转换成-1到1之间的值:yt=δ(W'ht)yseq=yt是矩阵中对应元素相乘,是进行矩阵相加。优选的,其特征在于,所述后端网络串行层包括多组全连接神经网络和dropout层,后端网络串行层接收LSTM网络层结果后,需要将这些并行结果进行累加求和得到唯一解,再送入后边的全连接与dropout网络结构层中进行处理,具体效果如下所示:本专利技术先对污水处理上报数据进行数值限值处理,去除不合理限值外数据。而且需要注意的是,由于污水数据是以时间逻辑顺序上报的,所以同一时间戳下数据代表了这个时间的水质情况,也就是说当水质中一个指标因不合格被去除后,这个时刻的其它数据也应当被去除,以保证数据时间逻辑的准确性。限值处理后,还需要对数据进行3倍标准差处理,因为污水处理上报数据分布情况是以正太分布的,所以超过3倍标准差的数值存在的概率大约为0.3%,而当这些上报数据的最大值(或最小值)与均值的差超过3倍标准差时,这些极值很可能存在问题,所以去除这些大概率有问题的极值,以提高数据质量。由于污水处理过程具有大时变、强耦合、大时滞、干扰严重以及生化反应复杂等特点,所以其上报数据质量差,水质预测难度较大,而本方法就可以很好的克服这些问题。本方法先对数据源进行有效清洗及梳理,去除干扰因素及噪点并明晰数据间关系,为数据分析做好前期工作。数据分析时,改进型LSTM网络可以很好对大时滞以及强耦合类数据进行分析,可以准确的映射出长时间跨度的数值关系,为污水水质预测提供了极大的便利。本专利技术的有益效果:1)改进型长短期记忆LSTM网络可以很好对大时滞以及强耦合类数据进行分析,可以准确的映射出长时间跨度的数值关系,为污水水质预测提供了极大的便利;2)本专利技术分析预测精度高。附图说明图1污水预测方法架构图;图2决策树关系分辨图,分别为剪枝后树形图、决策树整体图以及剪枝后误差效果对应图;图3改进型长短期记忆LSTM神经网络图;图4污水水质NH4、COD预测效果图。具体实施方式为了进一步说明本专利技术的技术效果,下面通过实施例对本专利技术进行具体描述。实施例1一种基于改进型长短期记忆LSTM神经网络的污水处理水质预测方法,本专利技术操作时本文档来自技高网
...

【技术保护点】
1.一种基于改进型长短期记忆LSTM神经网络的污水处理水质预测方法,其特征在于,包括以下步骤:/n1)数据处理:/n对污水处理上报数据进行预处理,接着对预处理的数据进行PCA降维,得到结果数据,然后利用决策树以及剪枝操作,选出结果数据的主要参量对应关系,建立参量映射关系表;/n2)建立并训练改进型长短期记忆LSTM神经网络预测模型:/n根据参量映射关系表确定改进型长短期记忆LSTM神经网络的输入与输出参量,建立改进型长短期记忆LSTM神经网络预测模型,并经过训练得到整体改进型长短期记忆LSTM神经网络预测模型;/n所述改进型长短期记忆LSTM神经网络包括输入层、前端网络并行层、LSTM网络层、后端网络串行层和输出层;/n3)将待预测数据导入整体改进型长短期记忆LSTM神经网络预测模型,输出得到预测水质数值。/n

【技术特征摘要】
1.一种基于改进型长短期记忆LSTM神经网络的污水处理水质预测方法,其特征在于,包括以下步骤:
1)数据处理:
对污水处理上报数据进行预处理,接着对预处理的数据进行PCA降维,得到结果数据,然后利用决策树以及剪枝操作,选出结果数据的主要参量对应关系,建立参量映射关系表;
2)建立并训练改进型长短期记忆LSTM神经网络预测模型:
根据参量映射关系表确定改进型长短期记忆LSTM神经网络的输入与输出参量,建立改进型长短期记忆LSTM神经网络预测模型,并经过训练得到整体改进型长短期记忆LSTM神经网络预测模型;
所述改进型长短期记忆LSTM神经网络包括输入层、前端网络并行层、LSTM网络层、后端网络串行层和输出层;
3)将待预测数据导入整体改进型长短期记忆LSTM神经网络预测模型,输出得到预测水质数值。


2.根据权利要求1所述的污水处理水质预测方法,其特征在于,所述预处理为去除污水处理上报数据中不合理限值外数据,然后对上报数据数据进行3倍标准差处理,去除上报数据的最大值或最小值与均值的差超过3倍标准差的数据。


3.根据权利要求1所述的污水处理水质预测方法,其特征在于,所述输入层为数据参量输入网络的对接接口,根据数据包含时间长度,将数据集合X分为n个部分,即将长时间跨度的一个数据分为相对短时间跨度的n个数据:
X=[x(1),x(2),...,x(n)]。


4.根据权利要求1所述的污水处理水质预测方法,其特征在于,所述前端网络并行层包括多组全连接神经网络和dropout层的并联形式,多组全连接神经网络中网络节点i和网络节点j之间的权值为wij,节点j的阀值...

【专利技术属性】
技术研发人员:刘晔晖冯骁夏文泽曲晓川王喆钱志明
申请(专利权)人:北京华展汇元信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1