一种基于特征工程的河涌水质预测方法技术

技术编号:33040069 阅读:40 留言:0更新日期:2022-04-15 09:20
一种基于特征工程的河涌水质预测方法,包括:步骤A:获取影响河涌水质的监测数据;步骤B:对影响河涌水质的监测数据进行预处理;步骤C:构造影响河涌水质的特征指标;步骤D:采用相关系数法进行特征指标筛选,包括通过Pearson相关系数法进行LSTM模型的特征筛选;步骤E:模型结构数据处理,包括将筛选的特征指标,进行LSTM模型结构数据预处理;步骤F:模型训练及自动调参,包括对LSTM模型进行训练和自动调优LSTM模型参数,保存最优模型至服务器上;步骤G:模型预测及结果评估,包括基于最优模型获取预测数据,评估预测数据与真实数据的偏差。本发明专利技术结合河涌的多因素、多条件影响因素,实现更准确、更全面反映水质变化的预测情况。更全面反映水质变化的预测情况。更全面反映水质变化的预测情况。

【技术实现步骤摘要】
一种基于特征工程的河涌水质预测方法


[0001]本专利技术涉及水质预测
,尤其涉及一种基于特征工程的河涌水质预测方法。

技术介绍

[0002]随着城市化进程的加快,城市内河涌的污染日益严峻,为了更高效的监管河涌水质及入河污染物的排放,提高河涌水污染的防治效率,环境管理部门需要更及时、更精准、更全面的了解河涌水质变化,并对主要排放口提前采取措施,提高河涌水质优良比。因此,对河涌的水质预测非常重要。
[0003]目前,水质预测方法主要包括:回归分析预测法、Markov法、时间序列分析预测法和函数模型预测法等传统预测法,以及神经网络模型、支持向量回归模型和灰色理论模型等新型水质预测模型。然而,在现有的河涌水质预测方法中,往往是针对某一方面的特征数据进行时间序列预测(例如,仅根据气象特征预测水质),并没有全面考虑影响水质的各方面因素,从而对河涌水质的预测效果不理想。
[0004]事实上,河涌水环境是一个多因素、多条件影响的复杂系统。污染物进入河涌后,会经历混合、稀释、扩散、沉淀等物理过程,以及氧化、还原、降解、吸收、吸附、凝聚等生化反应过程,从而使污染物浓度降低。其中,影响物理自净过程的主要是水文条件和污染物的物理性质。而影响生化反应过程的主要是污染物的化学性质、溶解氧、水温、酸碱度、水体生物种类等。对于以生活污水为主导的河涌,居民每天生活污水的排放比较有规律且相对稳定,河涌污染物的物理性质、化学性质、酸碱度、水体生物种类等,在短期内变化通常较小。
[0005]一般情况下,短期内影响河涌水质变化的主要是四个方面的原因:一是受上游来水、地表径流、沿途排放、降雨等外源污染的影响;二是受温度、风速,日照、气压、湿度等气象因素的影响;三是对河涌的调水、曝气等人工干预措施的影响;四是居民生活污水的排放规律。下面以河涌中的污染物氨氮为例说明具体影响因素:
[0006]一是降雨因素。一方面降雨会影响上游来水、地表径流等外源污染;另一方面降雨会影响水体的物理自净过程。在没有降雨的时候,城市河涌流速较慢,污染物迁移和扩散较慢,水体的物理自净能力较弱;在降雨的时候,河涌流速较快,污染物迁移和扩散较快,水体的物理自净能力显著增强。降雨对河涌水体污染物浓度的影响主要体现在:一是降雨历时。一般情况下,初期雨水中的主要污染物的浓度大于后期雨水,即出现“降雨初始冲刷效应”的现象。二是降雨强度。不同降雨量的溢流情况也不一样,小雨、中雨的溢流影响较小,对河涌水质的变化影响较小。而大雨、暴雨、大暴雨、特大暴雨对水质的变化影响较大。三是近期降雨情况。近期降雨量越小,本次强降雨对水质的波动影响越大。
[0007]二是温度、风速,日照、气压、湿度等气象因素。如图1,含氮化合物相互转化流程图。气象因素主要是通过影响河涌的溶解氧、水温的变化,从而影响氨氮的自然降解过程。如图2,溶解氧在水体中的传递过程包括:大气复氧、氨化作用、硝化作用、有机物降解、藻类呼吸作用及光合作用,其它物质降解、底泥耗氧、杂质吸附等。其中,大气复氧、光合作用受
温度、气压、风速、湿度、光照强度等气象因素的影响较大;而其它耗氧过程主要受水质污染浓度的影响。而影响水温的主要是气温、风速、相对湿度等气象因素,一般情况下,气温越高、相对湿度越大,水温越高;而风速越大,水温越低。
[0008]三是对河涌的调水、曝气等人工干预措施。从外江调入更干净的水质,增加曝气时长,都有利于加快水质自净过程,从而降低污染物浓度。
[0009]四是居民生活污水的排放规律。一般情况下,受居民生活规律的影响,居民人均排水量的最高峰时段出现在19:00—21:30,次高峰时段为06:30—10:30,00:00—5:00期间的排水量最低,沿途排放呈现昼夜周期性的波动。与此同时,河涌污染物的物理性质、化学性质、酸碱度、浓度等也呈现周期性变化。
[0010]因此,针对河涌水质的在线监测数据,迫切需要一种结合河涌的多因素、多条件影响因素,更准确、更全面反映水质变化的预测方法。

技术实现思路

[0011]本专利技术的目的在于针对
技术介绍
中的缺陷,提出一种基于特征工程的河涌水质预测方法,通过构建影响污染物浓度变化的昼夜变化特征指标、季节性变化特征指标、影响溶解氧、水温的气象因素特征指标、降雨特征指标、调水特征指标、曝气特征指标等,并利用相关系数法进行特征筛选,然后将数据标准化、三维数据转换,采用LSTM深度学习法构造模型,并采用贝叶斯优化的方式进行自动调整最优参数,最后将预测结果经过逆标准化转换后输出,实现结合河涌的多因素、多条件影响因素,更准确、更全面反映水质变化的预测情况。
[0012]为了解决上述问题,本专利技术提出了一种基于特征工程的河涌水质预测方法,包括如下步骤:
[0013]步骤A:获取影响河涌水质的监测数据;
[0014]步骤B:对影响河涌水质的监测数据进行预处理;
[0015]步骤C:构造影响河涌水质的特征指标;
[0016]步骤D:采用相关系数法进行特征指标筛选,包括通过Pearson相关系数法进行LSTM模型的特征筛选;
[0017]步骤E:模型结构数据处理,包括将筛选的特征指标,进行LSTM模型结构数据预处理;
[0018]步骤F:模型训练及自动调参,包括对LSTM模型进行训练和自动调优LSTM模型参数,保存最优模型至服务器上;
[0019]步骤G:模型预测及结果评估,包括基于最优模型获取预测数据,评估预测数据与真实数据的偏差。
[0020]优选的,在所述步骤A中,获取影响河涌水质的监测数据包括获取河涌污染物监测数据、调水记录、曝气设备运行记录以及气象数据。
[0021]优选的,在所述步骤B中,对影响河涌水质的监测数据进行预处理包括:
[0022]步骤B1:对监测数据的完整性进行检查,剔除显著异常值,包括剔除缺失值、NULL值、值不变和负值;
[0023]步骤B2:剔除监测仪器处于非正常监测时段的数据,非正常监测时段包括故障期
间、维修期间、超期限未校准时段、失控时段、有计划的维护保养时段和校准校验时段;
[0024]步骤B3:基于MAD法去除异常小和异常大的离群值。
[0025]优选的,在所述步骤C中,构造影响河涌水质的特征指标包括构造昼夜变化特征指标、季节性变化特征指标、影响溶解氧、水温的特征指标、降雨特征指标、调水特征指标和曝气特征指标。
[0026]优选的,构造昼夜变化特征指标包括:
[0027]引入日周期性特征指标参与LSTM模型训练预测,基于sin和cos将时间转换为清晰的“一天时间”的周期性信号;
[0028]转换过程包括:
[0029]将监测数据时间转化为时间戳格式,依次按照公式一至公式三进行转换;
[0030]day=24
×
60
×
60
‑‑
公式一;
[0031]Daysin=sin(时间戳
×
(2π/day))<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于特征工程的河涌水质预测方法,其特征在于,包括如下步骤:步骤A:获取影响河涌水质的监测数据;步骤B:对影响河涌水质的监测数据进行预处理;步骤C:构造影响河涌水质的特征指标;步骤D:采用相关系数法进行特征指标筛选,包括通过Pearson相关系数法进行LSTM模型的特征筛选;步骤E:模型结构数据处理,包括将筛选的特征指标,进行LSTM模型结构数据预处理;步骤F:模型训练及自动调参,包括对LSTM模型进行训练和自动调优LSTM模型参数,保存最优模型至服务器上;步骤G:模型预测及结果评估,包括基于最优模型获取预测数据,评估预测数据与真实数据的偏差。2.根据权利要求1所述一种基于特征工程的河涌水质预测方法,其特征在于:在所述步骤A中,获取影响河涌水质的监测数据包括获取河涌污染物监测数据、调水记录、曝气设备运行记录以及气象数据。3.根据权利要求1所述一种基于特征工程的河涌水质预测方法,其特征在于:在所述步骤B中,对影响河涌水质的监测数据进行预处理包括:步骤B1:对监测数据的完整性进行检查,剔除显著异常值,包括剔除缺失值、NULL值、值不变和负值;步骤B2:剔除监测仪器处于非正常监测时段的数据,非正常监测时段包括故障期间、维修期间、超期限未校准时段、失控时段、有计划的维护保养时段和校准校验时段;步骤B3:基于MAD法去除异常小和异常大的离群值。4.根据权利要求1所述一种基于特征工程的河涌水质预测方法,其特征在于:在所述步骤C中,构造影响河涌水质的特征指标包括构造昼夜变化特征指标、季节性变化特征指标、影响溶解氧、水温的特征指标、降雨特征指标、调水特征指标和曝气特征指标。5.根据权利要求4所述一种基于特征工程的河涌水质预测方法,其特征在于:构造昼夜变化特征指标包括:引入日周期性特征指标参与LSTM模型训练预测,基于sin和cos将时间转换为清晰的“一天时间”的周期性信号;转换过程包括:将监测数据时间转化为时间戳格式,依次按照公式一至公式三进行转换;day=24
×
60
×
60
‑‑
公式一;Daysin=sin(时间戳
×
(2π/day))
‑‑
公式二;Daycos=cos(时间戳
×
(2π/day))
‑‑
公式三;Daysin表示转换后的sin日周期性信号;Daycos表示转换后的cos日周期性信号;构造季节性变化特征指标包括:通过使用sin和cos将时间转换为清晰的“一年时间”的周期性信号;转换过程包括:将监测数据时间转化为时间戳格式,...

【专利技术属性】
技术研发人员:叶效强蒋鸿伟谭成灶胡晓辉梁文智李健森吴君句张广昕骆大清
申请(专利权)人:广东长天思源环保科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1