一种基于二次同构模态分解GRU模型的城市内涝预报方法技术

技术编号:38534135 阅读:8 留言:0更新日期:2023-08-19 17:05
本发明专利技术提出一种基于二次同构模态分解GRU模型的城市内涝预报方法,利用EMD

【技术实现步骤摘要】
一种基于二次同构模态分解GRU模型的城市内涝预报方法


[0001]本专利技术涉及城市内涝预报
,特别是一种基于二次同构模态分解GRU模型的城市内涝预报方法。

技术介绍

[0002]随着城市化程度提高,城市面积增大,柏油路、水泥路越来越多。大面积的混凝土地面透水性差,受到降雨的影响,经常导致城市内涝的发生。为了防止城市内涝对人民群众的生命财产安全造成危害,对城市内涝水深的预测预警很有必要,现有城市内涝水深的预测技术主要采用机理模型。
[0003]传统的城市雨洪机理模型众多,如SWMM、STORM、DR3M

QUAL,MOUSE,InfoWorks,SUSTAIN、SWC等模型,就SWMM模型而言,它可以模拟城市排水系统在降雨条件下的运行情况,预测雨水流量、污水流量、水位等参数。
[0004]现有的技术方案存在各种弊端,在机理模型的构建过程中,需要管网数据、GIS数据和历史水深及降雨量等数据,并且管网数据、GIS数据难以获取,影响了这些模型的推广使用。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于提供一种基于二次同构模态分解GRU模型的城市内涝预报方法,仅需要历史水深及降雨量数据,就具备比较强的非线性特征提取能力和内涝时序数据建模能力,可以更好地处理非线性和非平稳性数据,提高预测准确性和稳定性。
[0006]为实现上述目的,本专利技术采用如下技术方案:一种基于二次同构模态分解GRU模型的城市内涝预报方法,包括以下步骤:
[0007]步骤1:通过安装在内涝监测站点的传感器获取该监测点的降雨量和水深数据;
[0008]步骤2:首先对数据中的降雨量和水位数据进行相关性分析,选择相关性较高的特征集,之后利用孤立森林算法查找数据中的异常值;
[0009]步骤3:对数据的缺失值和异常值进行处理,然后进行训练集和测试集的划分;
[0010]步骤4:使用EMD方法对降雨量数据进行模态分解,经验模态分解技术让非平稳的降雨量数据平稳化;
[0011]步骤5:Lasso特征筛选和二次同构模态分解;
[0012]步骤6:数据归一化;
[0013]步骤7:建立GRU模型并训练;
[0014]步骤8:用未来降雨量数据对未来的水位进行预测
[0015]步骤9:GRU模型评估。
[0016]在一较佳的实施例中,所述步骤2具体为:
[0017]步骤21,数据相关性分析;将站点的水位数据和雨量数据规整到同一个表,对整合后的数据进行相关性分析,采用皮尔逊相关系数进行相关性分析;
[0018]皮尔逊相关系数定义为:
[0019][0020]其中cov为协方差,σ为标准差,X表示自变量,Y表示因变量,X表示降雨量,Y表示水位;
[0021]计算皮尔逊相关系数的方程如下所示:
[0022][0023][0024][0025]将上述公式代入定义中得,
[0026][0027]其中n为样本数量,r为相关系数;
[0028]由此计算出站点降雨量数据或者面降雨量数据和水位数据之间的相关系数,挑选出相关性较高的特征集;
[0029]步骤22,查找异常值;用孤立森林算法检测是否存在异常值;
[0030]首先将降雨量数据集、水深数据集数据随机划分为数据集X1,X2,

,Xn,模型根据随机划分数据集建立决策树Y1,Y2,

,Yn,然后模型随机选择降雨量或者水位特征集中的最大值和最小值作为一个分割值,来隔离离群值,使异常数据点在树中生成的路径更短,从而将它们和其他正常数据分开;利用集成学习的方法,多次重复上述步骤,完成孤立森林的构建,并根据异常分数判断该点是否为异常点,最终得出异常值;
[0031]设置孤立森林模型的参数值如下,树的数量n_estimators为100,异常点占比contamination为0.01,随机数生成器的种子random_state为0,随后训练模型,最终得到孤立森林模型,并使用孤立森林模型进行异常值的检测:将数据输入模型中进行预测,若值为

1,则为异常值,最后将所有异常值进行输出。
[0032]在一较佳的实施例中,所述步骤3具体为:
[0033]步骤31,在出现连续数天缺失值的情况下,进行缺失值的删除;
[0034]步骤32,异常值处理;将步骤2中使用孤立森林算法查找出的异常值,其处理方法:找出异常值所在的位置,删除异常值;将异常值前后两个值求和取平均填入该位置;
[0035]步骤33,数据集划分;示例的数据前70%作为训练集,后30%的数据作为测试集。
[0036]在一较佳的实施例中,所述步骤4具体为:
[0037]步骤41,找到原始降雨量时间序列x(t)的所有极大值和极小值点,对所有极值点利用三次样条插值法拟合上包络线U(t)和下包络线L(t);
[0038]步骤42,求上下包络线的均值M(t);
[0039]M(t)=(U(t)+L(t))/2 (6)
[0040]步骤43,原始序列减去均值包络线,得到中间序列h(t);
[0041]h(t)=x(t)

M(t) (7)
[0042]步骤44,判断h(t)是否满足IMF的两个约束条件,如果满足则是一个IMF分量,如果不满足则返回步骤1反复迭代;
[0043]步骤45,假设h(t)是一个IMF分量并记为IMF1,则重复步骤1

4将M(t)当做原始序列继续分解得到下一个IMF分量IMF2,直到残余分量是单调函数或常量时,停止分解;
[0044]分解完成后,原始序列x(t)表示为:
[0045]x(t)=∑IMF(i)+res (8)
[0046]经过EMD处理后,将得到的模态特征数据加入到数据集中,绘制原始降雨量数据和分解后的IMF图,分解后最后一个分量即是残余分量,记为res。
[0047]在一较佳的实施例中,所述步骤5具体为:
[0048]Lasso特征筛选:将上述EMD分解后的IMF分量进行Lasso筛选,最终得出多个筛选后的IMF分量;将上述EMD分解后的降雨量IMF分量作为一个待选择的特征集合,对各个特征进行标准化,使用Lasso模型对数据进行训练,通过对目标函数增加L1正则化项来惩罚模型的复杂度,得出各个特征相对应的特征系数,若特征系数为0,则弃用该特征,并根据特征系数的大小,从大到小依次选择特征;
[0049]将rt1、rt2、
……
、rt9作为一个待选择的特征集合放入Lasso模型中进行筛选,最终筛选出rt6分量;
[0050]两次EMD分解:将预处理后的降雨量和水位数据进行EMD分解,在lasso筛选出重要特征rt6之后,将rt6再一次进行EMD分解,得到rt6的模态数据后,对其进行Lasso筛选,最终得到rt6的重要特征;...

【技术保护点】

【技术特征摘要】
1.一种基于二次同构模态分解GRU模型的城市内涝预报方法,其特征在于,包括以下步骤:步骤1:通过安装在内涝监测站点的传感器获取该监测点的降雨量和水深数据;步骤2:首先对数据中的降雨量和水位数据进行相关性分析,选择相关性较高的特征集,之后利用孤立森林算法查找数据中的异常值;步骤3:对数据的缺失值和异常值进行处理,然后进行训练集和测试集的划分;步骤4:使用EMD方法对降雨量数据进行模态分解,经验模态分解技术让非平稳的降雨量数据平稳化;步骤5:Lasso特征筛选和二次同构模态分解;步骤6:数据归一化;步骤7:建立GRU模型并训练;步骤8:用未来降雨量数据对未来的水位进行预测步骤9:GRU模型评估。2.根据权利要求1所述的一种基于二次同构模态分解GRU模型的城市内涝预报方法,其特征在于,所述步骤2具体为:步骤21,数据相关性分析;将站点的水位数据和雨量数据规整到同一个表,对整合后的数据进行相关性分析,采用皮尔逊相关系数进行相关性分析;皮尔逊相关系数定义为:其中cov为协方差,σ为标准差,X表示自变量,Y表示因变量,X表示降雨量,Y表示水位;计算皮尔逊相关系数的方程如下所示:计算皮尔逊相关系数的方程如下所示:计算皮尔逊相关系数的方程如下所示:将上述公式代入定义中得,其中n为样本数量,r为相关系数;由此计算出站点降雨量数据或者面降雨量数据和水位数据之间的相关系数,挑选出相关性较高的特征集;步骤22,查找异常值;用孤立森林算法检测是否存在异常值;首先将降雨量数据集、水深数据集数据随机划分为数据集X1,X2,

,Xn,模型根据随机划分数据集建立决策树Y1,Y2,

,Yn,然后模型随机选择降雨量或者水位特征集中的最大值和最小值作为一个分割值,来隔离离群值,使异常数据点在树中生成的路径更短,从而将它们和其他正常数据分开;利用集成学习的方法,多次重复上述步骤,完成孤立森林的构
建,并根据异常分数判断该点是否为异常点,最终得出异常值;设置孤立森林模型的参数值如下,树的数量n_estimators为100,异常点占比contamination为0.01,随机数生成器的种子random_state为0,随后训练模型,最终得到孤立森林模型,并使用孤立森林模型进行异常值的检测:将数据输入模型中进行预测,若值为

1,则为异常值,最后将所有异常值进行输出。3.根据权利要求1所述的一种基于二次同构模态分解GRU模型的城市内涝预报方法,其特征在于,所述步骤3具体为:步骤31,在出现连续数天缺失值的情况下,进行缺失值的删除;步骤32,异常值处理;将步骤2中使用孤立森林算法查找出的异常值,其处理方法:找出异常值所在的位置,删除异常值;将异常值前后两个值求和取平均填入该位置;步骤33,数据集划分;示例的数据前70%作为训练集,后30%的数据作为测试集。4.根据权利要求1所述的一种基于二次同构模态分解GRU模型的城市内涝预报方法,其特征在于,所述步骤4具体为:步骤41,找到原始降雨量时间序列x(t)的所有极大值和极小值点,对所有极值点利用三次样条插值法拟合上包络线U(t)和下包络线L(t);步骤42,求上下包络线的均值M(t);M(t)=(U(t)+L(t))/2
ꢀꢀꢀꢀ
(6)步骤43,原始序列减去均值包络线,得到中间序列h(t);h(t)=x(t)

M(t)
ꢀꢀꢀꢀꢀ
(7)步骤44,判断h(t)是否满足IMF的两个约束条件,如果满足则是一个IMF分量,如果不满足则返回步骤1反复迭代;步骤45,假设h(t)是一个IMF分量并记为IMF1,则重复步骤1

4将M(t)当做原始序列继续分解得到下一个IMF分量IMF2,直到残余分量是单调函数或常量时,停止分解;分解完成后,原始序列x(t)表示为:x(t)=∑IMF(i)+res(8)经过EMD处理后,将得到...

【专利技术属性】
技术研发人员:马森标许权棕沈欣欣林立祥陈惠祥黄祖海陈友武刘雅瑜林大彬
申请(专利权)人:福建中锐汉鼎数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1