【技术实现步骤摘要】
一种基于生成对抗网络的深度学习水质指标预测方法
本专利技术属于污水处理
,尤其涉及一种基于生成对抗网络的深度学习水质指标预测方法。
技术介绍
水质指标可以作为水污染程度判断的标准尺度。通过水质自动监测站采集水质指标数据,并对采集到的水质指标时间序列数据进行分析和预测,能够提前获得水质指标的变化趋势,进而为水资源的管理与决策提供支持。水质指标变化受诸多因素影响,如物理、化学、生物等,且水质预测变量之间存在复杂的非线性关系,没有特定的周期性和稳定性。传统的水质指标预测方法普遍采用机理模型或线性模型对水质指标进行预测。机理模型是通过求解数学方程来求解不同时刻不同位置的污染物浓度,需要的参数较多,且难以获得,建模过程复杂;而线性模型缺乏对水质指标非线性特征的分析,对非线性的关系存在局限性,限制了预测的精确度。另一方面,由于传感器的收集频率不同,导致水质指标两次有效观测值之间的时间间隔不一致,并且传感器可能出现损坏,或在传感器网络传输的过程中出现数据丢失的情况,导致有较多的缺失值,而传统插值方法难以对水质指标的时间序列进行有效地处理。近年来随着数据量的增多,深度学习越来越成为时间序列预测的主流算法,广泛应用于水质环境中。深度学习,是更加自动化的机器学习方法,它能通过非线性函数将原始数据进行组合,转化为更高层次、更抽象的数据表示,充分挖掘变量之间的关系。一般的深度网络,在处理时间序列数据时,不考虑相邻数据之间的相关性,而循环神经网络(RecurrentNeuralNetwork,RNN)则考虑到这一点,将前一时刻的 ...
【技术保护点】
1.一种基于生成对抗网络的深度学习水质指标预测方法,其特征在于,该方法包括如下步骤:/n1)获取某河流过去的水质指标历史数据组成时间序列数据;/n2)该数据通过生成对抗网络(Generative Adversarial Networks,GAN)进行插值处理;/n3)将插值处理后的数据进行标准化处理,再按预设的滑动窗口宽度划分,转化为有监督的特征序列数据;/n4)将特征序列数据输入到通过教授约束(Professor Forcing)模式训练的长短期记忆(Long Short Term Memory,LSTM)网络模型中,再对模型输出进行反标准化,从而获得未来的水质指标预测结果。/n
【技术特征摘要】
1.一种基于生成对抗网络的深度学习水质指标预测方法,其特征在于,该方法包括如下步骤:
1)获取某河流过去的水质指标历史数据组成时间序列数据;
2)该数据通过生成对抗网络(GenerativeAdversarialNetworks,GAN)进行插值处理;
3)将插值处理后的数据进行标准化处理,再按预设的滑动窗口宽度划分,转化为有监督的特征序列数据;
4)将特征序列数据输入到通过教授约束(ProfessorForcing)模式训练的长短期记忆(LongShortTermMemory,LSTM)网络模型中,再对模型输出进行反标准化,从而获得未来的水质指标预测结果。
2.根据权利要求1所述的一种基于生成对抗网络的深度学习水质指标预测方法,其特征在于,步骤2具体为:
首先,通过一个时间间隔矩阵δ去记录两个有效观测值之间的时间间隔,公式如下:
其中,M为Mask矩阵,表示在时间步ti,特征j是否为有效观测值,是则否则
基于时间间隔矩阵δ,得到时间衰减向量β,用于控制过去观测值随时间的衰减,其范围通过指数函数控制在[0,1]之间,公式如下:
其中,wβ为衰减向量的权重,bβ为偏置项。时间间隔越大δ越大,则衰减向量β越小,说明过去的观测值的影响越小。
基于衰减向量β,更新GRU的隐藏单元时,通过衰减向量控制过去观测值的影响随时间增加而降低,更新过程如下:
通过真实样本x和生成样本G(z)之间的平方误差来表示重构误差(ReconstructionLoss),表明G(z)和x之间的差距:
Lr(z)=||x⊙M-G(z)⊙M||2
生成网络生成的样本的真实程度需要通过判别网络的结果获得,因此在训练生成网络时,联合判别网络的结果才能训练,其损失函数为:
因此,生成网络的损失函数由两部分组成:
Limputation(z)=Lr(z)+λLG(z)
其中,LG代表生成样本G(z)的真实程度,Lr代表真实样本x和生成样本G(z)的相似程度,λ为超参,控制二者的比例。
判别网络...
【专利技术属性】
技术研发人员:毕敬,王仔超,乔俊飞,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。