一种基于OVMD-GAT-GRU的流域水质预测方法技术

技术编号:38055792 阅读:13 留言:0更新日期:2023-06-30 11:21
本发明专利技术公开了一种基于OVMD

【技术实现步骤摘要】
一种基于OVMD

GAT

GRU的流域水质预测方法


[0001]本专利技术涉及水质预测
,尤其涉及一种基OVMD

GAT

GRU的流域水质预测方法。

技术介绍

[0002]水污染问题严重影响着人们的生产和生活,为了有效预防突发水污染事件,利用神经网络对河流水质进行提前预测得到关注。一个流域往往是由各级支流和干流构成的水网系统,支流和干流的相通性导致干流水质会受到支流汇入水的影响,河水的流动也导致上游污染物迁移扩散影响下游水质,即不同点位的水质数据在时空上具有一定关联性。随着流域水网中自动监测站点的不断增多,为了更加精准地预测水质,可以综合利用各监测点位水质数据的时空依赖关系进行预测建模。可现有的预测模型无法更好地表达水质数据的时空特征及非线性、非平稳性特点,不仅需要选用更加适合的时空神经网络,而且要尽量降低非平稳性对预测模型的影响,因此,如何构建高精度的水质预测模型需要进一步深入研究。

技术实现思路

[0003]基于
技术介绍
存在的技术问题,本专利技术提出了一种基于OVMD

GAT

GRU的流域水质预测方法。
[0004]本专利技术提出的一种基于OVMD

GAT

GRU的流域水质预测方法,包括以下步骤:
[0005]步骤一:数据集:对本次实验的水质数据源流域9个干流监测站、4个支流监测站的真实监测数据进行数据采集,实验使用氨氮(NH3

N)、总磷(TP)两个水质指标的监测数据,监测数据的时间步长为4小时,各站点监测数据序列的最大长度为1440,按照地表水水质国家标准,将氨氮和总磷监测数据中超出有效值的数据看作异常值,在数据对齐过程中和缺失值一起进行处理;
[0006]步骤二:水质监测数据对齐:以监测数据序列的最大长度1440作为基准,先确定对各站点氨氮和总磷监测数据的缺失值位置,并分析各数据系列的缺失模式是否满足多重插补条件,然后利用MI对缺失值进行临时填补,其中插补次数设为30、插补方法为MCMC、最大迭代次数为100、标度变量模型类型为PMM,接着对临时补全的数据系列再使用GRU进行双向预测,并使用双向预测结果的平均值再次填补缺失值得到最终的数据系列,另外,为了消除量纲对预测的影响,将各站点对齐后的监测数据进一步进行归一化处理;
[0007]步骤三:水质监测数据模态分解:为了降低数据复杂度提高预测精度,将对齐后的各站点氨氮、总磷监测数据利用OVMD方法进行模态分解,OVMD的参数设置如下:分解层数K为15,更新步长tau为0.57,带宽约束alpha为2000,收敛容错准则tol为1e

7;
[0008]步骤四:水质预测模型构建:水质预测模型采用PyTorch框架和Python语言实现,图神经网络基于PyTorch Geometric Temporal实现,预测模型的参数设置如表1所示,训练的前后部分分别使用了自适应矩估计优化器和随机梯度下降优化器,训练过程中取三次独
立训练的平均分作为最终评分,预测模型的输入特征为13个站点的邻接矩阵和2个指标的历史数据,数据滑动窗口长度设为6,滑动步长为1,模型输出设为6个时间步长(TS),训练集和测试集的划分比例为8:2;
[0009]步骤五:水质预测模型分析:针对氨氮、总磷的数据系列,分别得到6个不同TS的OVMD+GAT+GRU预测模型,各个预测模型的评价指标可以看出,氨氮、总磷的各个预测模型的RMSE和MAE值总体上较低,说明所有OVMD+GAT+GRU预测模型的误差都很小,氨氮、总磷前5个TS的预测模型的NSE值都大于0.8,只有在第6个TS时稍小于0.8,说明各个OVMD+GAT+GRU预测模型的预测值和真实值达到了很高的相关性;
[0010]步骤六:模型验证:将其与GCN+GRU和GAT+GRU预测模型的预测效果分别进行比较,其中每种预测模型分别选取第2,4,6预测步长的评价指标进行同比分析,分析数据可以看出,在各个预测步长情况下,氨氮和总磷的GAT+GRU预测模型的RMSE与MAE均低于GCN+GRU、NSE均高于GCN+GRU,说明GCN无法很好地抽取邻域节点重要性,同等情况下GAT忽视了不重要的节点信息,使空间特征提取能力更强,增强了预测模型的有效性和鲁棒性,从而促使GAT+GRU模型的预测性能相对GCN+GRU有了较大提升。
[0011]优选地,所述预测模型训练过程中采用下式的loss损失函数对模型参数进行调整优化,损失函数值越小预测结果越可靠,预测模型的评价指标选用MAE、RMSE、纳什效率系数,其中MAE和RMSE表示预测值相对实际值的误差大小,NSE表示预测值和实际值的相关程度,取值为(0,0.3]时表示微弱相关、取值为(0.3,0.5]时表示低度相关、取值为(0.5,0.8]时表示显著相关、取值为(0.8,1]时表示高度相关、取值为1表示完全相关,具体计算表达式如下所示,
[0012][0013][0014][0015][0016]其中N是干流上监测站点数,M是时间窗口大小,和分别为监测站点i在第j时间步的实际和预测水质信息,为样本Y的平均值。
[0017]优选地,所述水质预测模型在6个TS内均保持了较高的预测精度和性能,对比不同预测步长下的模型评价指标可以看出,随着预测步长的增加,水质预测模型的MAE和RMSE值在缓慢增大,而NSE值则在缓慢降低,说明水质预测模型的性能在逐渐变差,只是模型性能下降的速度比较小,从而保证了每个模型的预测精度均可以接受。
[0018]优选地,所述进一步比较OVMD+GAT+GRU模型和GAT+GRU模型的评价指标,可以看出在各个预测步长下,氨氮和总磷的OVMD+GAT+GRU预测模型的RMSE和MAE相比GAT+GRU都明显
下降、NSE则明显上升,说明OVMD对监测数据的分解降低了数据的复杂性,利用分解后的数据作为输入特征进一步地提升了GAT+GRU模型的预测精度。
[0019]优选地,所述变分模态分解VMD是一种信号分解估计方法,该方法通过迭代搜寻变分模型最优解来确定每个分量的频率中心和带宽,从而自适应地实现信号的频域剖分及各分量的有效分离,使每个模态的估计带宽之和达到最小,因此VMD可以有效减少时间序列的非平稳性,最优变分模态分解OVMD利用中心频率法确定分解层数K、利用残差指数REI确定更新步长tau,能有效优化VMD的性能。水质监测数据经过OVMD分解后可以降低数据复杂度、消除噪音干扰,将分解后的数据作为神经网络的输入特征有助于提高预测模型的准确性,残差指数REI具体公式如下:
[0020][0021]式中,U
k
为各分解模态,K为分解的模态数目,f为原始信号,N为信号的个数。
[0022]优选地,所述图注意力网络GAT是图卷积网络GCN的变种,通过聚合、更新、循环得到每个节点的表达,和G本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于OVMD

GAT

GRU的流域水质预测方法,其特征在于,包括以下步骤:步骤一:数据集:对本次实验的水质数据源流域9个干流监测站、4个支流监测站的真实监测数据进行数据采集,实验使用氨氮(NH3

N)、总磷(TP)两个水质指标的监测数据,监测数据的时间步长为4小时,各站点监测数据序列的最大长度为1440,按照地表水水质国家标准,将氨氮和总磷监测数据中超出有效值的数据看作异常值,在数据对齐过程中和缺失值一起进行处理;步骤二:水质监测数据对齐:以监测数据序列的最大长度1440作为基准,先确定对各站点氨氮和总磷监测数据的缺失值位置,并分析各数据系列的缺失模式是否满足多重插补条件,然后利用MI对缺失值进行临时填补,其中插补次数设为30、插补方法为MCMC、最大迭代次数为100、标度变量模型类型为PMM,接着对临时补全的数据系列再使用GRU进行双向预测,并使用双向预测结果的平均值再次填补缺失值得到最终的数据系列,另外,为了消除量纲对预测的影响,将各站点对齐后的监测数据进一步进行归一化处理;步骤三:水质监测数据模态分解:为了降低数据复杂度提高预测精度,将对齐后的各站点氨氮、总磷监测数据利用OVMD方法进行模态分解,OVMD的参数设置如下:分解层数K为15,更新步长tau为0.57,带宽约束alpha为2000,收敛容错准则tol为1e

7;步骤四:水质预测模型构建:水质预测模型采用PyTorch框架和Python语言实现,图神经网络基于PyTorch Geometric Temporal实现,预测模型的参数设置如表1所示,训练的前后部分分别使用了自适应矩估计优化器和随机梯度下降优化器,训练过程中取三次独立训练的平均分作为最终评分,预测模型的输入特征为13个站点的邻接矩阵和2个指标的历史数据,数据滑动窗口长度设为6,滑动步长为1,模型输出设为6个时间步长(TS),训练集和测试集的划分比例为8:2;步骤五:水质预测模型分析:针对氨氮、总磷的数据系列,分别得到6个不同TS的OVMD+GAT+GRU预测模型,各个预测模型的评价指标可以看出,氨氮、总磷的各个预测模型的RMSE和MAE值总体上较低,说明所有OVMD+GAT+GRU预测模型的误差都很小,氨氮、总磷前5个TS的预测模型的NSE值都大于0.8,只有在第6个TS时稍小于0.8,说明各个OVMD+GAT+GRU预测模型的预测值和真实值达到了很高的相关性;步骤六:模型验证:将其与GCN+GRU和GAT+GRU预测模型的预测效果分别进行比较,其中每种预测模型分别选取第2,4,6预测步长的评价指标进行同比分析,分析数据可以看出,在各个预测步长情况下,氨氮和总磷的GAT+GRU预测模型的RMSE与MAE均低于GCN+GRU、NSE均高于GCN+GRU,说明GCN无法很好地抽取邻域节点重要性,同等情况下GAT忽视了不重要的节点信息,使空间特征提取能力更强,增强了预测模型的有效性和鲁棒性,从而促使GAT+GRU模型的预测性能相对GCN+GRU有了较大提升。2.根据权利要求1所述的一种基于OVMD

GAT

GRU的流域水质预测方法,其特征在于,所述预测模型训练过程中采用下式的loss损失函数对模型参数进行调整优化,损失函数值越小预测结果越可靠,预测模型的评价指标选用MAE、RMSE、纳什效率系数,其中MAE和RMSE表示预测值相对实际值的误差大小,NSE表示预测值和实际值的相关程度,取值为(0,0.3]时表示微弱相关、取值为(0.3,0.5]时表示低度相关、取值为(0.5,0.8]时表示显著相关、取值为(0.8,1]时表示高度相关、取值为1表示完全相关,具体计算表达式如下所示,
其中N是干流上监测站点数,M是时间窗口大小,和分别为监测站点i在第j时间步的实际和预测水质信息,为样本Y的平均值。3.根据权利要求1所述的一种基于OVMD

GAT

GRU的流域水质预测方法,其特征在于,所述水质预测模型在6个TS内均保持了较高的预测精度和性能,对比不同预测步长下的模型评价指标可以看出,随着预测步长的增加,水质预测模型的MAE和RMSE值在缓慢增大,而NSE值则在缓慢降低,说明水质预测模型的性能在逐渐变差,只是模型性能下降的速度比较小,从而保证了每个模型的预测精度均可以接受。4.根据权利要求1所述的一种基于OVMD

GAT

GRU的流域水质预测方法,其特征在于,所述进一步比较OVMD+GAT+GRU模型和GAT+GRU模型的评价指标,可以看出在各个预测步长下,氨氮和总磷的OVMD+GAT+GRU预测模型的RMSE和MAE相比GAT+GRU都明显下降、NSE则明显上升,说明OVMD对监测数据的分解降低了数据的复杂性,利用分解后的数据作为输入特征进一步地提升了GAT+GRU模型的预测精度。5.根据权利要求1所述的一种基于OVMD

GAT

GRU...

【专利技术属性】
技术研发人员:宋金玲蒙海涛黄立明康燕
申请(专利权)人:河北科技师范学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1