【技术实现步骤摘要】
一种基于管网多元水质时序数据的水质异常事件识别预警方法
本专利技术涉及供水管网水处理
,具体涉及到一种基于管网多元水质时序数据的异常事件识别预警方法。
技术介绍
配水管网直接面向用户,是供水系统的一个重要环节,居民饮用水的清洁状况直接影响到人民的身体健康。管网内发生水质污染事件后,污染物会随着水质的运移快速的在管网中扩散,不仅会造成巨大的经济损失,影响供水安全,而且会造成环境破坏,影响社会秩序,甚至威胁到居民的生命安全。供水管网红、黄水事故频发,使得居民的用水安全受到威胁,因此快速发现水质污染事故和提升水质状况成为各地水务集团的重点关注内容。然而,当前水质污染事故检测缺乏有效的科学方法,更多依赖用户报告,水务集团才能获知水质污染事故的发生,而此时水质污染事故往往已经造成了大量的受污染水量,影响了居民的正常用水,人工举报方法已经严重影响了水务集团的供水服务水平和社会受认可度。因此供水管网水质事故快速预警成为供水系统管理领域的重要研究方向。针对管网内水质异常事件的识别与检测问题,国内外众多科研工作者已经展开了大量的工作。目前关于水质污染事件的研究,主要包括水质污染事故检测指标、基于统计分析的水质污染事故预警研究和基于神经网络数据驱动模型的水质污染事故预警研究三方面。现在的研究均存在一定的不足,不能很好的识别出不平稳水质事件序列的水质事件,在管网的实际应用中需要标定大量的参数,在不同地区的管网系统,在线水质监测平台测量的水质指标有不同,水质数据的测量精度也有不同,应用于不同地区管网时比较麻烦, ...
【技术保护点】
1.一种基于管网多元水质时序数据的水质异常事件识别预警方法,其特征在于,包括以下步骤:/n(1)对SCADA采集的监测点的水质数据进行预处理,模拟出模拟水质异常事件数据;/n(2)对预处理过的正常运行状态下的多个水质指标建立预测回归模型,每一种水质指标的预测均采用相同形式的输入输出格式,每一种水质数据的预测都采用多种机器学习方法进行下一时段水质指标值的预测;通过不同的机器学习回归方法得到不同指标的时段的预测值,利用水质指标的真实值与预测值的决定系数R
【技术特征摘要】
1.一种基于管网多元水质时序数据的水质异常事件识别预警方法,其特征在于,包括以下步骤:
(1)对SCADA采集的监测点的水质数据进行预处理,模拟出模拟水质异常事件数据;
(2)对预处理过的正常运行状态下的多个水质指标建立预测回归模型,每一种水质指标的预测均采用相同形式的输入输出格式,每一种水质数据的预测都采用多种机器学习方法进行下一时段水质指标值的预测;通过不同的机器学习回归方法得到不同指标的时段的预测值,利用水质指标的真实值与预测值的决定系数R2的值来评价回归预测模型的性能,保存每一种水质指标预测较好的机器学习回归预测模型,
(3)选择步骤(2)中每种水质指标的回归预测模型模型训练较好的模型进行集成,构建集成学习Stacking模型,将优选的回归模型进行优选后,stacking作为最终的回归预测模型;
(4)将步骤(2)中各水质指标的预测值与真实值进行残差计算,得到残差分布,确定残差分布的标准差;
(5)对步骤(3)得到的回归预测模型进行评价,选择合适的算数乘子,将其与残差分布标准差相乘作为阈值,当残差的绝对值超出阈值后作为一初始的异常点识别,该关系采用以下公式表示:
γi=Sd(ERi)×muli(3)
式中,γi为水质指标i的残差阈值;Sd(ERi)是步骤(4)中所得到水质指标i的残差分布的标准差;muli是确定水质指标i残差阈值时需要确定的算数乘子;I[ERi(t)]为指示函数,I[ERi(t)]=1表示水质指标i在时间t时模型识别为水质异常点,I[ERi(t)]=0表示水质指标i在时间t时模型识别为水质正常点;
(6)步骤(5)中的算数乘子的确定需要进行循环寻优,在(0,20)的范围内选择最优的算数乘子,确定的原则是让是让TPR尽可能大,FPR尽可能小,
式中,TPRi表示为当水质事件发生时水质指标i识别为异常点的概率,FPRi表示为正常运行状态下水质指标i识别为异常点的概率;TPi是当发生真实水质事件时水质指标i的残差识别为异常的个数,FNi是当发生真实水质事件时水质指标i的残差识别为正常的个数,FPi是正常运行状态下水质指标i的残差识别为异常的个数,TNi是正常运行状态下水质指i的残差识别为正常的个数;
利用有污染事件的水质数据进行TPR与FPR的计算,通过统计每一种水质指标预测情况下的TP,FP,FN,TN的个数,采用式(5)和式(6)计算得到每一种水质的TPR和FPR;
(7)利用时序贝叶斯原理进行水质异常事件的概率更新,当概率超过某一阈值时则对该水质指标进行事件报警,具体可以用以下表达式表示:
P(Et)=α×P(Et)+(1-α)×P(Et-1)(10)
式中,Ot表示为t时刻残差检测为异常点情况;表示为t时刻残差检测为正常的情况;Et表示为t时刻真实发生水质事件的情况;P(Et)表示为在t时刻模型预测的真实会发生水质异常事件的概率;α为光滑系数;为防止快速收敛,给定P(Et)的上下界...
【专利技术属性】
技术研发人员:李子林,刘海星,刘双,裴圣伟,彭勇,张弛,
申请(专利权)人:大连理工大学,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。