当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于分布自适应图注意力网络的洪水预报方法技术

技术编号:38724270 阅读:5 留言:0更新日期:2023-09-08 23:17
本发明专利技术公开了一种基于分布自适应图注意力网络的洪水预报方法,包括:对收集的目标流域数据进行预处理,构建流域数据集,生成水文站节点同质图;进行降雨时序数据分布相似性表征,得到降雨分布最不相似的K段多元时间序列;利用水文站节点同质图和多元时间序列,通过图注意力网络GAT和循环神经网络GRU进行洪水预报泛化模型的训练;通过洪水预报泛化模型进行洪水预报。本发明专利技术使用图神经网络结合循环神经网络联合学习空间特征信息和时间特征信息,并借鉴自注意力机制增强了水文特征要素中的关键信息,从而能够更高效地捕获时序信息,并且提高洪水预报的准确度。提高洪水预报的准确度。提高洪水预报的准确度。

【技术实现步骤摘要】
一种基于分布自适应图注意力网络的洪水预报方法


[0001]本专利技术属于洪水预报领域,涉及深度学习技术,具体涉及一种基于分布自适应图注意力网络的洪水预报方法。

技术介绍

[0002]洪水预报是一种非工程的预防洪水灾害措施,可以通过及时有效的洪水预警预报帮助人们有效地防御洪水,减轻洪灾带来的经济和社会损失,是重要的防灾减灾应用。目前,洪水预报一般采用基于径流过程的水文模型和数据驱动的智能模型两种方式,它们在实际预报中相互补充。径流过程模型基于水文物理过程,考虑河流和降雨的交互作用,但存在许多参数需要校准和估计,且建模难度大;而数据驱动建模则基本不考虑水文过程的物理机制,是以建立输入输出数据之间的最优数学关系为目标的黑箱方法,他需要足够的历史数据进行训练。
[0003]在机器学习中,往往假设数据处在同一分布,但是在实际应用中,时间序列的分布随时间变化时有发生,即非平稳特性。近年来,许多基于深度学习方法的时间序列预测模型被用来建立可靠的、准确的非平稳TS模型。
[0004]洪水预报也是时间序列预报的一种。与普通的时间序列预测相比,它面临着更多的挑战。当洪水数据集时间年份比较长的时候,可能会产生气候变化,从而导致降雨的强度、频次等发生变化,这种变化是不可预知的,所以需要相应的方法去减小协变量漂移的影响,提高洪水预报的准确度。除此以外,洪水预报不仅要考虑降雨分布变化的问题,还要考虑大量的水文空间信息,例如,上游降雨将影响下游流量,距离比较近的雨量站会有相似的降雨情况。在建模时综合考虑降雨分布的变化特性以及空间特征,训练出一个较强的适用于多种分布的泛化模型显得尤为重要。

技术实现思路

[0005]专利技术目的:为了克服现有技术中存在的不足,提供一种基于分布自适应图注意力网络的洪水预报方法,在解决分布差异的前提下,实现水文数据空间特征的提取,提高了洪水预报的准确度。
[0006]技术方案:为实现上述目的,本专利技术提供一种基于分布自适应图注意力网络的洪水预报方法,包括如下步骤:
[0007]S1:对收集的目标流域数据进行预处理,构建流域数据集,生成水文站节点同质图;
[0008]S2:基于流域数据集,进行降雨时序数据分布相似性表征,得到降雨分布最不相似的K段多元时间序列;
[0009]S3:利用水文站节点同质图和多元时间序列,通过图注意力网络GAT和循环神经网络GRU进行洪水预报泛化模型的训练,得到训练好的洪水预报泛化模型;
[0010]S4:通过洪水预报泛化模型进行洪水预报。
[0011]进一步地,所述步骤S1中目标流域数据包括雨量站数据、流量站数据和流域情况数据。
[0012]进一步地,步骤S1中整合目标流域内的降雨和流量的时序监测数据并进行数据归一化用于预报,同时收集目标流域的地理空间数据、水利工程情况数据用于划分多元数据集、构建水文站邻接矩阵输入GAT网络。
[0013]所述步骤S1的具体过程为:
[0014]A1:对数据进行清洗,包括数据缺失值处理、数据异常值处理;
[0015]A2:对地面雨量测站进行数据归一化;
[0016]A3:对多元时间序列数据进行滑动窗口处理,将无监督数据处理为有监督数据;
[0017]A4:将有监督数据进行模型训练集、模型验证集和模型测试集的划分,构建流域数据集;
[0018]A5:根据流域数据集中的多元时间序列数据计算皮尔逊相关系数得到其关联性,并结合地理空间信息,生成水文站节点同质图。
[0019]进一步地,步骤S2结合了降雨序列分布变化的思想,进行降雨时序数据分布相似性表征,经过该模块可以得到多个降雨分布最不相似的多元时间序列段。
[0020]所述步骤S2中使用时序分布相似性模块对多元时间序列进行表征,计算雨量和流量序列之间的皮尔逊相关系数,并结合贪心算法对多元洪水时间序列进行分段,把时间序列划分成K段最不相似的时间序列。
[0021]皮尔逊相关系数的计算公式如下所示:
[0022][0023]进一步地,所述步骤S2中结合贪心算法对多元洪水时间序列进行分段的过程为:
[0024]B1:利用皮尔逊相关系数衡量输入的不同特征对最终结果的相关关系,得到了一个权重矩阵,将矩阵乘以相关的输入值,得到了有空间权重因子的输入;
[0025]该权重因子与输入相乘,可以考虑到空间性对划分过程的影响,公式如下所示:
[0026]d(D
i
,D
j
)=d(Spearman(x,y)*{x

,y

})
[0027]B2:将时间序列均匀地分成十个片段,起点为A,终点为B,遍历9个分裂点,找到一点C来最大化分布距离d(S
CB
,S
AC
),选择对抗性距离作为距离度量公式,然后再使用相同的策略来选择另一个点D;
[0028]B3:得到划分点后,将划分的比例乘以训练集的长度,输入到Dataloader中得到最终的多段训练集。
[0029]进一步地,所述步骤S3中洪水预报泛化模型的训练方法为:对于划分出的K段多元时间序列,使用图注意力网络GAT学习水文站节点的空间信息,接着通过循环神经网络GRU学习时间步之间的依赖关系,并内嵌自注意力机制模块来学习每个时间段内部的序列信息的重要性;利用Boosting的方法来动态度量不同时间序列隐状态变量的重要性,并最小化领域差异损失以达到缩小分布漂移影响的目的。
[0030]进一步地,所述步骤S3中对于划分出的多段多元洪水序列,使用图注意力网络GAT学习水文站节点的空间信息,接着通过循环神经网络GRU学习时间步之间的依赖关系,并内嵌自注意力机制模块来学习每个时间段内部的序列信息的重要性,利用Boosting的方法来
动态度量不同时间序列隐状态变量的重要性,并最小化领域差异损失以达到缩小分布漂移影响的目的;
[0031]洪水预报泛化模型的训练过程为:
[0032]C1:通过图注意力网络提取降雨特征节点之间的空间信息,学习水文站空间关系的嵌入表示,具体的提取过程为:
[0033]假设一个图有N个节点,节点的F维特征集合输入输出表示为:
[0034]Input:
[0035]Output:
[0036]计算顶点i与周围邻居节点j∈N
i
的相似度,其中W是一个权重矩阵,会被所有共享;公式最外层的a表示单层前馈神经网络(使用LeakyReLu作为激活函数),输出为一个数值;
[0037][0038]进行归一化,使用Softmax进行归一化,具体公式如下所示:
[0039][0040]其中,||表示向量拼接,得到注意力系数之后,对邻居节点的特征进行加权求和,这样就得到了输出维度:
[0041][0042]C2:将作为输入的X
t
,使用GRU门控神经网络来提取不同段时间序列的隐状态变量,以提取时间序本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于分布自适应图注意力网络的洪水预报方法,其特征在于,包括如下步骤:S1:对收集的目标流域数据进行预处理,构建流域数据集,生成水文站节点同质图;S2:基于流域数据集,进行降雨时序数据分布相似性表征,得到降雨分布最不相似的K段多元时间序列;S3:利用水文站节点同质图和多元时间序列,通过图注意力网络GAT和循环神经网络GRU进行洪水预报泛化模型的训练,得到训练好的洪水预报泛化模型;S4:通过洪水预报泛化模型进行洪水预报。2.根据权利要求1所述的一种基于分布自适应图注意力网络的洪水预报方法,其特征在于,所述步骤S1中目标流域数据包括雨量站数据、流量站数据和流域情况数据。3.根据权利要求2所述的一种基于分布自适应图注意力网络的洪水预报方法,其特征在于,所述步骤S1的具体过程为:A1:对数据进行清洗,包括数据缺失值处理、数据异常值处理;A2:对地面雨量测站进行数据归一化;A3:对多元时间序列数据进行滑动窗口处理,将无监督数据处理为有监督数据;A4:将有监督数据进行模型训练集、模型验证集和模型测试集的划分,构建流域数据集;A5:根据流域数据集中的多元时间序列数据计算皮尔逊相关系数得到其关联性,并结合地理空间信息,生成水文站节点同质图。4.根据权利要求1所述的一种基于分布自适应图注意力网络的洪水预报方法,其特征在于,所述步骤S2中使用时序分布相似性模块对多元时间序列进行表征,计算雨量和流量序列之间的斯皮尔曼相关系数,公式如下所示,把时间序列划分成K段最不相似的时间序列。5.根据权利要求4所述的一种基于分布自适应图注意力网络的洪水预报方法,其特征在于,所述步骤S2中结合贪心算法对多元洪水时间序列进行分段的过程为:B1:利用皮尔逊相关系数衡量输入的不同特征对最终结果的相关关系,得到了一个权重矩阵,将矩阵乘以相关的输入值,得到了有空间权重因子的输入;该权重因子与输入相乘,可以考虑到空间性对划分过程的影响,公式如下所示:d(D
i
,d
j
)=d(Spearman(x,y)*{x',y'})B2:将时间序列均匀地分成十个片段,起点为A,终点为B,遍历9个分裂点,找到一点C来最大化分布距离d(S
CB
,S
AC
),选择对抗性距离作为距离度量公式,然后再使用相同的策略来选择另一个点D;B3:得到划分点后,将划分的比例乘以训练集的长度,输入到Dataloader中得到最终的多段训练集。6.根据权利要求1所述的一种基于分布自适应图注意力网络的洪水预报方法,其特征在于,所述步骤S3中洪水预报泛化模型的训练方法为:对于划分出的K段多元时间序列,使用图注意力网络GAT学习水文站节点的空间信息,接着通过循环神经网络GRU学习时间步之间的依赖关系,并内嵌自注意力机制模块来学习每个时间段内部的序列信息的重要性;利用Boosting的方法来动态度量不同时间序列隐状态变量的重要性,并最小化领域差异损失以达到缩小分布漂移影响的目的。
7.根据权利要求6所述的一种基于分布自适应图注意力网络的洪水预报方法,其特征在于,所述步骤S3中洪水预报泛化模型的训练过程为:C1:通过图注意力网络提取降雨特征节点之间的空间信息,学习水文站空间关系的嵌入表示,具体的提取过程为:假设一个图有N个节点,节点的F维特征集合输入输出表示为:假设一个图有N个节点,节点的F维特征集合输入输出表示为:计算顶点i与周围邻居节点j∈N
i
的相似度,其中W是一个权重矩阵,会被所有共享;公式最外层的a表示单层前馈神经网络,输出为一个数值;进行归一化,使用Softmax进行归一化,具体公式如下所示:其中,||表示向量拼接,得到注意力系数之后,对邻居节点的特征进行加权求和,这样就得到了输出维度:C2:将作为输入的X
t
,使用GRU门控神...

【专利技术属性】
技术研发人员:冯钧茆元慧陆佳民巫义锐
申请(专利权)人:河海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1