一种基于门控图神经网络的供水管网水质异常污染源识别方法技术

技术编号:38326071 阅读:13 留言:0更新日期:2023-07-29 09:08
本发明专利技术提供一种基于门控图神经网络的供水管网水质异常污染源识别方法,属于供水管网水处理技术领域。本发明专利技术首先,抽象出管网的拓扑结构并构建有向图的邻接矩阵;其次,收集传感器监测站点的污染物浓度信息;再次,构造基于GGNN的污染源定位模型;最后,识别污染源节点的区域。本发明专利技术中提出的基于GGNN的污染源定位模型适用于任何规模的供水管网,能够预测污染事件发生后供水管网中每个节点成为污染源的概率。水务集团可以根据污染源定位模型的预测结果选择概率最高的几个节点,以缩小污染源的可能区域,为保障供水安全提供了更加可靠的手段。手段。手段。

【技术实现步骤摘要】
一种基于门控图神经网络的供水管网水质异常污染源识别方法


[0001]本专利技术属于供水管网水处理
,涉及到一种基于门控图神经网络的供水管网水质污染事故的污染源识别方法。

技术介绍

[0002]供水管网是为消费者提供安全和充足饮用水的关键基础设施,是保障公众健康的重要组成部分。然而,由于管理不善,例如与非饮用管道的交叉连接、漏水接头、主管道破裂、泵站停运和消毒剂残留物的腐败等原因,供水管网内很容易发生污染事件和公共卫生风险。这些污染事件可能发生在供水管网的任何地点,并且在网络中迅速传播,影响大量客户。因此,及时检测和定位污染事件对于通过开发有效的补救措施来最小化损失并保护公共健康至关重要。传统上,水务公司依赖客户报告污染事件,然而,由于时间滞后和不同的客户反应,这显著限制了他们减少污染风险的能力。随着数字技术的快速发展,许多城市已经越来越多地部署在线水质传感器来监测供水管网的实时水质。这些数据可以用于检测和定位污染事件,并进行例行水质监测。
[0003]在城市供水系统中,污染事件的快速和准确识别是保障公共卫生和水质安全的重要任务。然而,由于经济约束和城市水需求的固有变异性等实际原因,水质传感器的部署数量较少,仅能采集空间上稀疏的水质数据,这给污染源识别带来了挑战。此外,污染的迅速传播可能会导致危害的加剧,因此污染事件的及时定位对于开发有效的算法至关重要。因此,需要开发快速而准确的污染源识别方法,以应对水质安全面临的挑战。
[0004]对于水质污染事故污染源的识别,现有的研究主要集中在粒子追踪、统计建模和模拟优化方法。粒子追踪方法依赖于供水管网内水流量,以建立输入和输出位置水质之间的联系,并使用非线性编程方法解决污染源识别问题。然而,流量的不确定性可能影响这些方法的应用。在模拟优化方法中,水力模型如EPANET被用于通过优化潜在的污染位置来识别污染源。这些方法的计算成本很高。统计建模方法基于有限的传感器站观测数据,使用最大似然方法、逻辑回归和贝叶斯统计等来确定潜在的污染源位置的概率。但这些方法的预测精度受到传感器可用性、测量精度和水需求不确定性的影响。此外,大多数统计建模方法的计算复杂度随着管网的规模增长而增加,使它们在较大的供水系统中不太实用。总的来说,目前的模型在实际应用中存在模型精度受数据质量影响较大,计算用时长等问题。
[0005]由于机器学习能够快速处理多维、多站点的数据,并且能够在评估新观测数据方面高效地提供高精度的预测能力,目前已经应用于实时水质异常事故检测。然而,在污染源定位方面,迫切需要开发新的基于机器学习的方法来有效地捕捉供水管网中水力和水质的复杂空间动态,以提高预测准确性。

技术实现思路

[0006]对于上述不足,本专利技术要解决的问题是提供一种供水管网的水质异常污染源识别
方法,通过图神经网络将多个水质传感器站点的数据与供水管网的拓扑结构相结合,有效捕捉节点间空间相关性,实现水质异常事故污染源识别的实时自动化,提高模型的污染源识别精度,减少定位精度对监测数据不确定性的影响。
[0007]为了达到上述的目的,本专利技术采用的技术方案为:
[0008]一种基于门控图神经网络(GGNN)的供水管网水质异常污染源识别方法,首先,抽象出管网的拓扑结构并构建有向图的邻接矩阵;其次,收集传感器监测站点的污染物浓度信息;再次,构造基于GGNN的污染源定位模型;最后,识别污染源节点的区域。具体包括以下步骤:
[0009](1)抽象出管网的拓扑结构并构建有向图的邻接矩阵。
[0010]将有n个节点的供水管网抽象为图结构G=(V,E),其中V是顶点集合(|V|=n,n表示供水管网节点个数),边集合E表示节点之间的连接关系。在供水管网中,水库、水箱和用水节点可以表示为节点或顶点,而连接它们的管道、阀门和泵可以表示为边。利用EPANET进行水力建模,收集管网的空间拓扑结构信息和水流向信息,构建有向图的邻接矩阵
[0011]所述的有向图的邻接矩阵的行列分别对应管网中的节点,其中A
ij
是邻接矩阵A中第i行,第j列的元素,表示节点i是否有水流流向节点j。当有水流从节点i流向节点j时,A
ij
=1,否则,A
ij
=0。
[0012](2)收集水质监测传感器站点的污染物浓度信息。
[0013]在供水管网的各个节点利用EPANET进行水质污染模拟,采集水质监测传感器站点的污染物浓度信息,并将其分为训练集和测试集。水质监测传感器站点的水质数据由供水管网中的监控与数据采集系统(SCADA)进行收集。当任何一个水质监测传感器站点接收到超过浓度阈值的被污染水时,SCADA系统将发出警报,然后收集接下来N
c
个时间步长的水质数据(包含污染物的浓度),并用作监测节点的节点属性x。对于未受监控的节点,空值可以替换为0作为节点属性。表示为每一个节点v∈V的节点属性,包含了N
c
个水质时序数据信息,N
c
表示所需的用于确定污染源的水质数据长度,代表污染源识别模型的检测时间。
[0014]增加水质数据量可以增加污染源的污染信息,但这会增加污染源识别模型的定位时间。减少水质数据可以缩短污染源识别模型的定位时间,但这会减少污染信息并因此降低污染源识别模型的准确性。
[0015](3)构造基于GGNN的污染源定位模型。GGNN将步骤(1)中收集的供水管网有向图的邻接矩阵以及步骤(2)中收集的传感器监测站点的污染物浓度信息作为输入,输出为污染源定位模型预测的每个节点是污染源的概率。具体的模型构建包括以下部分:
[0016]3.1基于步骤(1)中获取的管网有向图的邻接矩阵利用公式(1)拼接邻接矩阵A及其转置A
T
,得到扩展的邻接矩阵
[0017][0018]其中,是传统邻接矩阵的扩展,考虑了有向图中入边和出边的影响,用于描述图中节点之间的消息传递方向。在有向图中,传统的邻接矩阵只能捕捉从一个节点到其邻居节点的连接关系,而无法反映反向连接关系。为了克服这个限制,GGNN使用了
扩展的邻接矩阵,它同时考虑了节点之间的前向和反向连接关系,使得GGNN能够双向学习和传递信息,从而提高了它在捕捉图中节点之间复杂关系方面的能力。
[0019]3.2对于每一个节点v∈V,基于步骤(2)中收集的节点属性x
v
,得到初始隐藏状态h
v(0)
。为了提高GGNN的效率,在将节点属性用作初始隐藏状态之前,利用一个映射函数g(
·
)将其列向量维度扩大:
[0020]h
v(0)
=g(x
v
)(2)
[0021]其中,为节点v初始时刻的状态向量。
[0022]在本专利技术中,g(
·
)采用了一层神经网络的线性层和ReLU激活函数,将节点v的属性向量映射成初始的隐藏状态向量M表示隐藏状态的维度大小。较大的M值将增加模型可以学习和表本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于门控图神经网络的供水管网水质异常污染源识别方法,其特征在于,首先,抽象出管网的拓扑结构并构建有向图的邻接矩阵;其次,收集传感器监测站点的污染物浓度信息;再次,构造基于GGNN的污染源定位模型;最后,识别污染源节点的区域。2.根据权利要求1所述的一种基于门控图神经网络的供水管网水质异常污染源识别方法,其特征在于,包括以下步骤:(1)抽象出管网的拓扑结构并构建有向图的邻接矩阵;将有n个节点的供水管网抽象为图结构G=(V,E),其中V是顶点集合(|V|=n,n表示供水管网节点个数),边集合E表示节点之间的连接关系;在供水管网中,水库、水箱和用水节点可以表示为节点或顶点,而连接它们的管道、阀门和泵可以表示为边;利用EPANET进行水力建模,收集管网的空间拓扑结构信息和水流向信息,构建有向图的邻接矩阵所述的有向图的邻接矩阵的行列分别对应管网中的节点,其中A
ij
是邻接矩阵A中第i行,第j列的元素,表示节点i是否有水流流向节点j;当有水流从节点i流向节点j时,A
ij
=1,否则,A
ij
=0;(2)收集水质监测传感器站点的污染物浓度信息;在供水管网的各个节点利用EPANET进行水质污染模拟,采集水质监测传感器站点的污染物浓度信息,并将其分为训练集和测试集;水质监测传感器站点的水质数据由供水管网中的监控与数据采集系统SCADA进行收集;当任何一个水质监测传感器站点接收到超过浓度阈值的被污染水时,SCADA系统将发出警报,然后收集接下来N
c
个时间步长的水质数据,包含污染物的浓度,并用作监测节点的节点属性x;对于未受监控的节点,空值可以替换为0作为节点属性;表示为每一个节点v∈V的节点属性,包含了N
c
个水质时序数据信息,N
c
表示所需的用于确定污染源的水质数据长度,代表污染源识别模型的检测时间;(3)构造基于GGNN的污染源定位模型;GGNN将步骤(1)中收集的供水管网有向图的邻接矩阵以及步骤(2)中收集的传感器监测站点的污染物浓度信息作为输入,输出为污染源定位模型预测的每个节点是污染源的概率;模型构建包括以下:3.1基于步骤(1)中获取的管网有向图的邻接矩阵利用公式(1)拼接邻接矩阵A及其转置A
T
,得到扩展的邻接矩阵得到扩展的邻接矩阵其中,是传统邻接矩阵的扩展;3.2对于每一个节点v∈V,基于步骤(2)中收集的节点属性x
v
,得到初始隐藏状态h
v(0)
;为提高GGNN的效率,在将节点属性用作初始隐藏状态之前,利用一个映射函数g(
·
)将其列向量维度扩大:h
v(0)
=g(x
v
)(2)其中,为节点v初始时刻的状态向量;3.3使用门控循环单元GRU,将步骤3.1中得到的扩展邻接矩阵和步骤3.2得到的节点的初始隐藏状态h
(0)
作为输入,循环K个时间步计算得到的每个节点最终的状态向量具体过程如下所示:
r
v(k)
=σ(W
r
·
a
v(k)
+U
r
·
h
v(k

1)
)(4)z
v(k)
=σ(W
z
·
a
v(k)
+U
z
·
h
v(k

1)
)(5)(5)其中,是扩展邻接矩阵的一个块矩阵,由中与节点v有关的两列组成;a
v(k)
是节点v在时间步k的聚合向量,聚合节点v的邻接节...

【专利技术属性】
技术研发人员:李子林刘海星徐佳雨刘璇张弛
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1