【技术实现步骤摘要】
一种基于无监督叠加集成的供水管网爆管检测与识别方法
[0001]本专利技术属于城市供水管网爆管检测领域,尤其涉及一种基于无监督叠加集成的供水管网爆管检测与识别方法
。
技术介绍
[0002]爆管是供水系统的一种主要失水形式,尽管持续时间短但失水量大
。
爆管不仅会造成大量水资源浪费,也会导致管网压力下降影响正常供水
。
此外,管道破裂后也容易发生污染物入侵从而影响饮用水水质
。
爆管检测方法能够帮助供水公司及时发现爆管,从而对爆管进行修复减少爆管的危害
。
[0003]研究人员提出了各种爆管检测方法,由于数据采集和监控
(SCADA)
系统的大量使用,基于数据驱动的方法得到了广泛使用
。
根据检测原理可以分为基于分类的方法
、
基于预测的方法和基于统计的方法
。
基于分类的方法利用历史爆管数据对模型进行训练,然后对爆管进行检测,但是这种方法需要大量的历史爆管数据
。
基于预测的方法则是利用正常的监测数据对模型进行训练,然后利用模型预测值来检测实时监测数据是否出现异常
。
基于统计的方法则是将历史监测数据与实时监测数据进行比较,如果实时监测数据超过阈值则进行报警
。
考虑到基于预测的方法受预测精度的影响,可能会出现虚假报警的情况
。
而基于统计的方法只利用现有数据特征对爆管进行检测,省略了预测过程从而显著提高了爆管检测精度 ...
【技术保护点】
【技术特征摘要】
1.
一种基于无监督叠加集成的供水管网爆管检测与识别方法,其特征在于,包括如下步骤:步骤
(1)
:利用
EPANET
对管网模型进行水力模拟,得到供水管网正常工况和异常工况下各个压力监测点的压力监测数据;步骤
(2)
:构建供水管网爆管检测与异常识别框架,该框架包含4个异常检测模块:
(a)
单点异常检测模块;
(b)
单点定性检测模块;
(c)
监测点自身序列模块;
(d)
监测点之间序列模块;步骤
(3)
:准备训练数据,对各个异常检测模块进行训练,确定各个模块的阈值;步骤
(4)
:利用异常检测框架对各种异常情景进行检测,得到管网爆管和监测点发生故障的情况
。2.
根据权利要求1所述一种基于无监督叠加集成的供水管网爆管检测与识别方法,其特征在于,步骤
(1)
具体包括如下步骤:步骤
(1.1)
,利用
EPANET
对管网进行水力模拟,得到管网正常工况下各个压力监测点的压力监测数据,如下式所示:式中,表示管网正常工况下压力监测点
k1在第0天
t
时刻的压力监测数据,表示管网正常工况下压力监测点
k
n
在第
n
d
天
t
时刻的压力监测数据;步骤
(1.2)
,利用
EPANET
对管网各个管道发生爆管的情况进行水力模拟,得到管网发生爆管时各个压力监测点的压力监测数据,如下式所示:式中,表示管网管道
pipe1发生爆管后压力监测点
k1在
t
时刻的压力监测数据;表示管网管道
pipe
P
发生爆管后压力监测点
k
n
在
t
时刻的压力监测数据;步骤
(1.3)
,考虑监测点发生故障的情况,向供水管网正常工况下的压力监测数据中添加部分错误数据,得到监测点发生故障情况下的压力监测数据,考虑了以下几种情况:
(a)
异常监测值;
(b)
数据延迟;
(c)
监测点编号错误
。3.
根据权利要求1所述一种基于无监督叠加集成的供水管网爆管检测与识别方法,其特征在于,步骤
(2)
具体包括如下步骤:步骤
(2.1)
,构建四个异常检测模块,对各个压力监测点压力监测数据中的单点异常和时间序列异常进行检测,检测到供水管网实时监测数据中的异常值,实现异常检测;步骤
(2.2)
,如果检测到供水管网的实时监测数据存在异常值,则根据四个异常检测模块的报警情况对各种供水管网各种异常情景进行区分,对供水管网发生爆管和监测系统出现故障的情况进行准确区分
。
4.
根据权利要求3所述一种基于无监督叠加集成的供水管网爆管检测与识别方法,其特征在于,所述步骤
(2.1)
具体包括:步骤
(2.1.1)
,单点异常检测模块研发:单点异常检测模块主要是对单个异常监测数据进行检测,为了提高单点异常检测的精度,对多种机器学习算法进行了集成,单点异常检测模块分为三层:
(a)
第一层为独立森林算法;
(b)
第二层为
K
‑
均值聚类和局部异常值概率算法;
(c)
第三层为
K
‑
均值聚类和局部异常值概率算法输出结果的集成;对于监测点
k
i
,单点异常识别模块的输入数据为:式中:为监测点
k
i
在第
n
d
天
t
时刻的监测值;首先,将
p(k
i
)
输入到独立森林算法中,得到各个
p
t
(k
i
)
的异常得分:的异常得分:式中,表示
p(k
i
)
中第
i
个观测值的异常得分
,i
=
0,1,
…
,n
d
,,为二进制搜索树中搜索不成功的平均路径长度,
e
,
Tr
为树的总数,是观测值的路径长度,是的平均值;在得到各个监测点的各个实时监测数据的异常得分后,将各个实时监测数据的异常得分作为输入,进入单点异常检测模块的第二层,分别在
K
‑
均值聚类和局部异常值概率算法中得到各个异常得分的异常检测结果;在
K
‑
均值聚类中,对
s
t
(k
i
)
中的各个异常得分进行聚类,得到二进制数据,如果正常则为0,如果异常则为1;在
K
‑
均值聚类中,初始聚类列表为每个被分到与其平方欧式距离最近的聚类中:式中:为第
i
个聚类;
s
p
为各个异常得分的数据集;为第
i
个监测点在
t
数时刻的监测值;为第
j
个监测点在
t
数时刻的监测值;
k
为监测点总的数量;
j
为监测点的编号;
t
为各个监测点采集数据的时刻;然后,采用下式对每个聚类进行更新:式中:
s
j
为该聚类内的各个异常得分分数;为
t
时刻的第
i
个聚类;为第
i
个聚类在
t+1
时刻的聚类中心;
x
j
为聚类
C
i
内第
j
个异常得分的值;
从形式上讲,目标是得到下式所示的关系:式中,
ρ
为各个聚类的中心,
VarC
i
为聚类
C
i
内各个异常得分的方差,
s
为聚类
C
i
内各个监测数据的异常得分,
C
i
为第
i
个聚类,
Ξ
i
是
C
i
中各点的平均值,即最小化相同聚类中各个监测值的成对平方偏差:设
C
为
K
‑
均值聚类算法的输出,
C
为一组大小为
n
d
+1
的聚类标签,
C
i
=1或
x
和
y
均为聚类内的监测值,
k
为监测值点总的数量;在局部异常值概率算法中,得到各个监测值异常得分的概率,各个的概率由从到参考点
R
的标准距离得到:式中,表示和
r
之间的距离度量,采用欧几里得距离;点
s
i
到参考点
R
的概率集距离具有“显著性”λ
,定义为:然后,使用最近邻作为参考集,最近邻是由独立森林算法得到的观测值之间最近的欧式距离,对于给定的领域大小
k
和显著性
λ
,监测值的概率局部异常因子
PLOF
定义为:最后,计算得到成为局部异常值的概率:设
L
为局部异常值概率算法的输出,为一组长度为
n
d
+1
的概率;
l
i
表示第
i
个成为异常值的概率,
0≤l
i
≤1
;在得到各个异常得分的聚类结果和成为异常值的概率后,进入单点异常检测模块的第三层,根据
K
‑
均值聚类和局部异常值概率算法的输出结果,最终得到各个实时监测数据
s
t
(k
i
)
成为异常值的概率,第
i
个观测值
s
t
(k
i
)
成为异常值的概率为:
P
i
=
C
i
·
l
i
;在
K
‑
均值聚类中,聚类的个数
K
=2,
K
‑
均值聚类将所有监测值分为正常和异常两组,由于它最小化了平方和,从而避免给不同于正常数据的监测值增加更多的权重,将正常数据分到同一个聚类中,然而,在第二个分组中,可能将正常数据或者小的变化看作是离群值,正常数据标记为0,异常数据标记为1,因此,
c
i
=0表示正常数据,
c
i
=1表示异常值,另外,接近0的
l
i
表示正常数据,通过将
K
‑
均值聚类结果与局部异常值概率算法结果相乘,避免了将正态数据...
【专利技术属性】
技术研发人员:胡祖康,陈先明,张俊,周小国,陈文然,汪雨恬,李忠明,
申请(专利权)人:长江生态环保集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。