双阶段时空注意力机制的污染源-水质预测模型权重影响计算方法技术

技术编号:33134718 阅读:21 留言:0更新日期:2022-04-17 00:57
本发明专利技术公开一种双阶段时空注意力机制的污染源

【技术实现步骤摘要】
双阶段时空注意力机制的污染源

水质预测模型权重影响计算方法


[0001]本专利技术属于水环境管理
,尤其涉及一种双阶段时空注意力机制的污染源

水质预测模型权重影响计算方法。

技术介绍

[0002]水质指标是衡量河流水质指标的非常重要的尺度。从以前的人工采样到现在越来越多的河流采用水质自动监测站实时采集水质指标数据。水质指标的变化佷容易受到污水排放,降雨,空气质量以及农业生产等外界因素的影响,有非常强的非线形特征,缺乏周期性和稳定性。而传统的水质指标模型大都采用线性模型进行建模预测分析。线形模型限制了模型的精确度,缺乏对水环境中多非线形特征的分析。此外,水体环境异常复杂,水质指标序列存在较大噪声,导致传统模型在复杂条件下难以有效预测真实水环境指标。
[0003]目前,随着边缘计算设备以及各类水质传感器的发展,数据变得愈加多样与丰富。深度学习逐渐成为了时间序列预测的主流算法,已经广泛应用在水环境相关数据分析处理上。目前大多数水质指标数据属于长相关时间序列,即序列中可能存在间隔或延迟相对较长,但对下一时刻值影响较大的重要事件,传统神经网络很难捕捉到这种跨度很长的关键信息。此外水质序列与污染源序列之间的相关研究也相对较困难,难以分析其影响权重。双阶段注意力机制循环在编码器的输入阶段引入了注意力机制,从而同时实现了选取特征因子和把握长期时序依赖关系。

技术实现思路

[0004]针对以上现有技术的不足,本专利技术提供一种基于SG(Savitzky Golay)滤波与双阶段时空注意力机制的循环神经网络(Dual

stage Spitial and Temporal Attention

based Recurrent Neural Network,DSTA

RNN)污染源

水质预测模型权重影响计算方法,其中包括:基于SG滤波的水质时间序列预处理方案,以及基于双阶段时空注意力机制的循环神经网络污染源

水质预测模型。
[0005]本专利技术的目的通过以下技术方案来实现,即一种双阶段时空注意力机制的污染源

水质预测模型权重影响计算方法,具体步骤如下:
[0006]步骤1:获取河流过去一段时间监测到的水质指标组成的时间序列数据及周边污染源的污染排放数据;
[0007]步骤2:对两类数据进行SG滤波平滑降噪预处理;
[0008]步骤3:将预处理后的数据进行Z

score标准化处理,再按预设的滑动窗口宽度划分为多个子序列,并划分训练集和测试集;
[0009]步骤4:根据训练集的历史数据训练污染源水质预测模型,将训练集的特征序列数据输入DSTA

RNN模型中,将模型的输出值与真实值进行对比,算出损失率,利用反向传播训练模型的参数;
[0010]步骤5:输出模型中学习到的各污染源驱动序列的平均权重,用于分析各污染源各时刻对于水质的贡献度。
附图说明
[0011]图1双阶段时空注意力机制的污染源

水质预测模型权重影响计算方法示意图;
[0012]图2 SG滤波流程图;
[0013]图3 DSTA

RNN结构图。
具体实施方式
[0014]下面将详细描述本专利技术各个方面的特征和示例性实施例。下面的描述涵盖了许多具体细节,以便提供对本专利技术的全面理解。但是,对于本领域技术人员来说显而易见的是,本专利技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本专利技术的示例来提供对本专利技术更清楚的理解。本专利技术绝不限于下面所提出的任何具体配置和算法,而是在不脱离本专利技术的精神的前提下覆盖了相关元素、部件和算法的任何修改、替换和改进。
[0015]下面将参照附图1来描述根据本专利技术实施例的一种基于SG滤波与DSTA

RNN的污染源水质影响权重的计算方法具体步骤如下:
[0016]第一步,获取一条河过去一段时间的监测的水质以及污染源的时间序列数据
[0017]由于水质自动监测系统实际的监测频次通常为每4小时监测一次,污染源在线监测数据采集间隔为一小时一次。在数据预处理阶段,对水质参数数据筛选,统一调整为4小时等间隔的数据。将这四小时内的每小时排放量进行累加,作为该污染源每四小时的排放数据。对于缺失数据,用线性插值法补齐数据。
[0018]第二步,将水质指标时间序列数据用SG滤波预处理
[0019]由于数据中可能存在噪声点,往往会导致非线性模型的过拟合出现,通过使用SG方法对原始数据进行平滑滤波,降低噪声的干扰,可以有效的抑制非线性模型过拟合的出现。图2为SG滤波的实施方法流程图。SG滤波的原理如下:
[0020]SG平滑滤波对低次多项式用最小二乘法拟合相邻的数据点的连续子集,其中,相邻的多项式数据点的个数称为滤波窗口宽度,如下公式是多项式,
[0021][0022]其中,水环境时间序列数据由n个x
j
水质指标组成(j=1,...,n),滤波窗口宽度为m,用一组m个卷积系数C
i
对窗口的水质指标x
i+j
使用最小二乘法进行拟合。
[0023]卷积系数C
i
的推导:假设数据由一组n个点(z
j
,x
j
)(j=1,...n)构成,其中z
j
是水质指标的相对时序位置,x
j
是j时间点的水质指标。多项式将通过线型最小二乘拟合到一组m(奇数)相邻数据点,设滤波窗口宽度为m,采用k次多项式对窗口的数据点进行拟合。
[0024]x=a0+a1z+a2z2+

+a
k
‑1z
k
‑1。
[0025]形成n个方程,构成k元线性方程组,并通过最小二乘法拟合确定参数A,用矩阵表
示为:
[0026]X
m
×1=Z
m
×
k
·
A
k
×1。
[0027]A的最小二乘解为:
[0028][0029]表达式中的X的系数C被称为卷积系数,得到的卷积系数C是一个矩阵:
[0030]C=(X
T
·
X)
‑1·
X
T

[0031]第三步,归一化处理,并通过滑动窗口划分特征序列数据
[0032]滤波后的数据要做以下滑动窗口处理,以便模型输入。
[0033](1)对上一步处理后的数据进行Z

score归一化处理。具体的公式如下:
[0034][0035]其中μ是样本数据的平均值,σ是样本数据的标准差。
[0036](2)滑动窗口宽度设定为输本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种双阶段时空注意力机制的污染源

水质预测模型权重影响计算方法,其特征在于,包括如下步骤:步骤1:获取河流过去一段时间监测到的水质指标组成的时间序列数据及周边污染源的污染排放数据;步骤2:对两类数据进行SG(Savitzky Golay)滤波平滑降噪预处理;步骤3:将预处理后的数据进行Z

score标准化处理,再按预设的滑动窗口宽度划分为多个子序列,并划分训练集和测试集;步骤4:根据训练集的历史数据训练污染源水质预测模型,将训练集的特征序列数据输入双阶段时空注意力机制循环神经网络(Dual

stage Spitial and Temporal Attention

based Recurrent Neural Network,DSTA

RNN)模型中,将模型的输出值与真实值进行对比,算出损失率,利用反向传播训练模型的参数;步骤5、输出模型中学习到的各污染源驱动序列的权重,用于分析各污染源各个时刻对于水质的贡献度。2.根据权利要求1所述的方法,其特征在于,步骤2中,在进行卷积的过程中,SG平滑滤波对低次多项式用最小二乘法拟合相邻的数据点的连续子集,其中,相邻的多项式数据点的个数称为滤波窗口宽度,如下公式是多项式,其中,水环境时间序列数据由n个x
j
水质指标组成(j=1,

,n),滤波窗口宽度为m,用一组m个卷积系数C
i
对窗口的水质指标x
i+j
使用最小二乘法进行拟合。卷积系数C
i
的推导:假设数据由一组n个点(z
j
,x
j
)(j=1,

n)构成,其中z
j
是水质指标的相对时序位置,x
j
是j时间点的水质指标。多项式将通过线型最小二乘拟合到一组m(奇数)相邻数据点,设滤波窗口宽度为m,采用k次多项式对窗口的数据点进行拟合。x=a0+a1z+a2z2+

+a
k
‑1z
k
‑1。形成n个方程,构成k元线性方程组,并通过最小二乘法拟合确定参数A,用矩阵表示为:X
m
×1=Z
m
×
k
·
A
k
×1。A的最小二乘解为:表达式中的X的系数C被称为卷积系数,得到的卷积系数C是一个矩阵:C=(X
T
·
X)
‑1·
X
T
。3.根据权利要求1所述的方法,步骤4中其特征在于,所述DSTA

RNN模型使用双阶段时空注意力机制建模。其第一阶段关注空间特征,用编码器用以...

【专利技术属性】
技术研发人员:毕敬曹广磊乔俊飞
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1