一种多项式与偏最小二乘耦合的非线性回归洪水要素预测方法技术

技术编号:35440461 阅读:33 留言:0更新日期:2022-11-03 11:50
本发明专利技术提供一种多项式与偏最小二乘耦合的非线性回归洪水要素预测方法,包括以下步骤:S1、收集已知洪水信息,建立因变量、自变量数据集;S2、采用多项式特征构造工程方法,开展特征多项式变换,增加原始输入特征维度;S3、对所有数据进行归一化处理,然后将处理后的数据集划分为训练集和测试集两部分;S4、采用偏最小二乘回归方法建立模型;S5、在训练集上优化模型参数,在测试集上测试模型的可靠性,直至预测精度满足要求;S6、利用预测模型对未知洪水要素预测。该方法具有非线性,可在汛期复杂降雨情况下,通过简单操作获取未来洪水信息,具有预见期不受限制、工作量小、参数少、精度高、可靠性高等优点,大大提高了水文预报的效率。率。率。

【技术实现步骤摘要】
一种多项式与偏最小二乘耦合的非线性回归洪水要素预测方法


[0001]本专利技术涉及水文预报领域,特别涉及一种多项式与偏最小二乘耦合的非线性回归洪水要素预测方法。

技术介绍

[0002]洪水中的洪峰、洪量、降雨径流系数等要素预报是洪水预报中的重要项目,可用于防汛抗旱、水资源开发利用等,尤其洪峰为防汛抢险提供了依据,大大保护了人民的生命财产安全。
[0003]大量关于洪水预报模型的研究已经开展,尽管如此,目前洪水预报大多依赖于传统预报模型,而传统预报模型参数较多,需要耗费大量的时间进行建模和参数率定,并且对历史洪水资料要求较高,不能充分利用每一场洪水过程资料。为此,需要从数据挖掘、机器学习等角度出发提出简洁高效的新方法,深入、系统地挖掘已有的洪水数据,用较少的参数构建模型,实现洪水主要要素的预测。

技术实现思路

[0004]本专利技术所要解决的技术问题是提供一种多项式与偏最小二乘耦合的非线性回归洪水要素预测方法,使得原线性回归模型具有非线性性能,能描述洪水各项指标之间复杂的非线性关系,能快速且准确预测出多项洪水主要要素,即一个模型可输出多项内容,不用重复建模。
[0005]为解决上述技术问题,本专利技术所采用的技术方案是:一种多项式与偏最小二乘耦合的非线性回归洪水要素预测方法,包括以下步骤:S1、收集已知洪水信息,建立因变量、自变量数据集;S2、采用多项式特征构造工程方法,开展特征多项式变换,增加原始输入特征维度;S3、对所有数据进行归一化处理,然后将处理后的数据集划分为训练集和测试集两部分;S4、采用偏最小二乘回归方法建立模型;S5、在训练集上采用网格搜索优化模型参数,在测试集上测试模型的可靠性,直至预测精度满足要求;S6、利用预测模型对未知洪水要素预测。
[0006]优选的方案中,所述步骤S1包括以下步骤:S11、选取多场已知洪水场次过程,包含大、中、小场次过程;S12、提取每一场洪水过程的多个洪水要素,即因变量,因变量包括洪峰、洪量、降雨径流系数;S13、提取每一场洪水过程的多个洪水指标,即自变量,称为原始输入特征,原始输
入特征包括降雨量、降雨历时、降雨强度、前期影响雨量、起涨流量、最大24小时降雨。
[0007]优选的方案中,所述步骤S2包括以下步骤:S21、构造多项式特征,多项式特征变换使用sklearn中的PolynomialFeatures工具,原始输入特征为6个,X={X1,X2,X3,X4,X5,X6},X
i
为第i项特征向量,X为m行6列矩阵,m为样本集数量,开展d阶多项式变换,公式如下:式中,d≥0且取整数,为多项式的阶数参数,需要进行率定验证;函数F为原始输入特征组成的多项式函数,最终特征为多项式函数F的项;S22、将变换之后高维度的特征作为模型输入,所需预测的洪水要素即因变量作为模型输出,整理成相应的数据集。
[0008]优选的方案中,所述步骤S3中,数据集归一化处理的公式如下:X

i
=X
i

min(X
i
)/max(X
i
)

min(X
i
)式中,X

i
为归一化后的X
i
特征,min(X
i
)为该项特征向量中的最小值,max(X
i
)为该项特征向量中的最大值。
[0009]优选的方案中,所述步骤S3中,所述训练集与测试集的比例为0.75~0.8:0.2~0.25。
[0010]优选的方案中,所述步骤S4中偏最小二乘回归方法包括以下步骤:S41、将原始输入特征X={X1,X2,X3,X4,X5,X6}进行多项式变化,将多项式的项作为新的输入数据集X={x1,...,x
p
},其中n表示原始输入特征个数,d表示多项式阶数;S42、将新的输入数据集作为偏最小二乘回归模型输入,模型直接调用sklearn中的 PLSRegression工具。
[0011]优选的方案中,所述步骤S5中包括以下步骤:S51、模型的参数通过交叉验证的方法在训练集上进行优化得到最优的学习算法,即,将各个参数可能的取值进行排列组合,列出所有可能的组合结果生成“网格”,然后将各组合用于模型训练,并使用交叉验证对表现进行评估,在模型尝试了所有的参数组合后,返回一个合适的分类器,自动调整至最佳参数组合;S52、在测试集上测试模型的可靠性,预测精度满足要求则停止,否则返回至S51步骤,可靠性的评价指标包括可决系数R2或Nash

Sutcliffe效率系数(NSE),两者值越靠近1越优,其中,可决系数R2计算公式如下:Nash

Sutcliffe效率系数(NSE)计算公式如下:
式中,y
i
是观测值、是观测值的均值、为模型预测值、为模型预测值。
[0012]优选的方案中,所述步骤S6中包括以下步骤:S61,提取已知的洪水过程的多个洪水指标,即原始输入特征信息;S62,输入原始特征信息,使用模型,预测未知洪水要素。
[0013]本专利技术提供的一种多项式与偏最小二乘耦合的非线性回归洪水要素预测方法,利用多项式与偏最小二乘耦合的非线性回归方法预测洪水要素,使得原线性回归模型具有非线性性能,能描述洪水各项指标之间复杂的非线性关系,能快速且准确预测出多项洪水主要要素,即一个模型可输出多项内容,不用重复建模。与传统洪水预报模型相比,节省了大量的参数率定工作,可在汛期复杂降雨情况下,通过较简单操作获取洪水信息,具有预见期不受限制、工作量小、参数少、精度高、可靠性高等优点,大大提高了水文预报的效率。
附图说明
[0014]下面结合附图和实施例对本专利技术作进一步说明:图1为本专利技术的方法流程图;图2为本专利技术具体实施方式的所选流域示意图;图3为本专利技术实施例中在训练集和测试集上的洪峰预测情况;图4为本专利技术实施例中在训练集和测试集上的洪量预测情况;图5为本专利技术实施例中在训练集和测试集上的降雨径流系数预测情况。
具体实施方式
[0015]一种多项式与偏最小二乘耦合的非线性回归洪水要素预测方法,如图1所示,包括以下步骤:S1、收集已知洪水信息,建立因变量、自变量数据集。
[0016]所述步骤S1包括以下步骤:S11、选取多场已知洪水场次过程,包含大、中、小场次过程;S12、提取每一场洪水过程的多个洪水要素,即因变量,因变量包括洪峰、洪量、降雨径流系数;S13、提取每一场洪水过程的多个洪水指标,即自变量,称为原始输入特征,原始输入特征包括降雨量、降雨历时、降雨强度、前期影响雨量、起涨流量、最大24小时降雨。
[0017]S2、采用多项式特征构造工程方法,开展特征多项式变换,增加原始输入特征维度。
[0018]所述步骤S2包括以下步骤:S21、构造多项式特征,多项式特征变换使用sklearn中的PolynomialFeatures工具,原始输入特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多项式与偏最小二乘耦合的非线性回归洪水要素预测方法,其特征在于,包括以下步骤:S1、收集已知洪水信息,建立因变量、自变量数据集;S2、采用多项式特征构造工程方法,开展特征多项式变换,增加原始输入特征维度;S3、对所有数据进行归一化处理,然后将处理后的数据集划分为训练集和测试集两部分;S4、采用偏最小二乘回归方法建立模型;S5、在训练集上采用网格搜索优化模型参数,在测试集上测试模型的可靠性,直至预测精度满足要求;S6、利用预测模型对未知洪水要素预测。2.根据权利要求1所述的一种多项式与偏最小二乘耦合的非线性回归洪水要素预测方法,其特征在于,所述步骤S1包括以下步骤:S11、选取多场已知洪水场次过程,包含大、中、小场次过程;S12、提取每一场洪水过程的多个洪水要素,即因变量,因变量包括洪峰、洪量、降雨径流系数;S13、提取每一场洪水过程的多个洪水指标,即自变量,称为原始输入特征,原始输入特征包括降雨量、降雨历时、降雨强度、前期影响雨量、起涨流量、最大24小时降雨。3.根据权利要求1所述的一种多项式与偏最小二乘耦合的非线性回归洪水要素预测方法,其特征在于,所述步骤S2包括以下步骤:S21、构造多项式特征,多项式特征变换使用sklearn中的PolynomialFeatures工具,原始输入特征为6个,X={X1,X2,X3,X4,X5,X6},X
i
为第i项特征向量,X为m行6列矩阵,m为样本集数量,开展d阶多项式变换,公式如下:式中,d≥0且取整数,为多项式的阶数参数,需要进行率定验证;函数F为原始输入特征组成的多项式函数,最终特征为多项式函数F的项;S22、将变换之后高维度的特征作为模型输入,所需预测的洪水要素即因变量作为模型输出,整理成相应的数据集。4.根据权利要求1所述的一种多项式与偏最小二乘耦合的非线性回归洪水要素预测方法,其特征在于,所步骤S3中,数据集归一化处理的公式如下:X

i
=X
i

min(X
i
)/max(X
i
)

min(X
i
)式中,X

【专利技术属性】
技术研发人员:吴碧琼曹辉汤正阳姚华明张海荣张东杰曾志强王骁鹏
申请(专利权)人:中国长江电力股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1