System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于机器学习的大坝变形可解释预测方法技术_技高网

基于机器学习的大坝变形可解释预测方法技术

技术编号:40559017 阅读:11 留言:0更新日期:2024-03-05 19:20
本发明专利技术公开基于机器学习的大坝变形可解释预测方法,包括以下步骤:步骤1、对大坝上监测点连续监测获取待处理数据,并对待处理数据进行剔除粗差的预处理工作;步骤2、获得大坝变形预测模型A;步骤3、评价模型A预测的精确度;步骤4、使用SHAP可解释方法对步骤3构建的大坝变形预测模型A进行因子剔除得到模型B;步骤5、采用控制变量法获得预测效果最好的模型C;步骤6、通过使用SHAP可解释方法对步骤5构建的大坝变形预测模型C进行画图分析获得的瀑布图定量分析不同影响因子对大坝变形模型预测结果的影响。该方法可以有效的提高大坝变形数据的预测精度并解释机器学习黑箱模型的内部机理。

【技术实现步骤摘要】

本专利技术属于大坝安全监测方法,具体涉及基于机器学习的大坝变形可解释预测方法


技术介绍

1、水能资源的高效利用对实现绿色可持续发展有着不可替代的作用。与其他基础设施一样,大坝在服役过程中也会受到各种物理、化学等不确定性因素的影响,致使大坝出现老化、病险,甚至失效。变形是能最直观反映大坝安全性态的效应量之一。

2、传统的统计回归监测模型存在精度差的问题,对变量间的非线性关系拟合精度较差。近年来,一些机器学习算法虽然在模型精度上有显著地提升,如增强回归树、支持向量机(svm ,support vector machines)、随机森林(rf,random forest),但这些模型都属于黑箱模型,只能得到预测结果,无法解释模型预测结果是如何得到的,很大程度上动摇了模型的可信度并制约了其应用范围。


技术实现思路

1、本专利技术的目的是提供基于机器学习的大坝变形可解释预测方法,该方法可以有效的提高大坝变形数据的预测精度,并且使用shap(shapley additive explanation)可解释方法定量化解释机器学习模型的机理。

2、本专利技术所采用的技术方案是,基于机器学习的大坝变形可解释预测方法,包括以下步骤:

3、步骤1、对大坝上监测点连续监测获取待处理数据,并对待处理数据进行剔除粗差的预处理工作;

4、步骤2、选取水压因子、温度因子及时效因子作为lightgbm(light gradientboosting machine)模型的输入量,将监测点的径向水平位移作为lightgbm模型的输出量;

5、步骤3、对步骤1预处理后的数据随机进行训练集及测试集的划分,将划分好的训练集带入lightgbm模型中构建起大坝变形预测模型a并评价模型a预测的精确度;

6、步骤4、使用shap可解释方法对步骤3构建的大坝变形预测模型a进行分析,剔除掉存在多重共线性的因子,将剩下的因子重新作为lightgbm模型的输入量构建起模型b;

7、步骤5、采用控制变量法调整模型b的参数获得预测效果最好的模型c;

8、步骤6、通过使用shap可解释方法对步骤5构建的大坝变形预测模型c进行画图分析获得的瀑布图定量分析不同影响因子对大坝变形模型预测结果的影响。

9、本专利技术的特征还在于,步骤1具体为:对大坝上的监测点进行连续监测获取大坝的径向水平位移数据及对应的水位、温度、时效的环境量数据,并对获取的大坝径向水平位移数据以及水压、温度、时效的环境量数据进行剔除粗差的预处理工作。

10、步骤2中,水压因子选取、、,表示月平均库水位、表示月平均库水位的二次方、表示月平均库水位的三次方;温度因子选取、、、、,表示监测日当天的平均温度、表示监测日前五天的平均温度、表示监测日前三十天的平均温度、表示监测日前六十天的平均温度、表示监测日前九十天的平均温度;时效因子选取、,为累计进行观测的天数除以100。

11、步骤3具体为:对步骤1预处理后的数据随机进行训练集及测试集的划分,其中80%作为训练集,20%作为测试集;将划分好的训练集带入到步骤2中确认好输入量及输出量的lightgbm模型中构建起大坝变形预测模型a,通过平均绝对误差mae(mean absoluteerror)、相关系数r2(correlation coefficient)及均方根误差rmse(root mean squareerror)作为模型评价指标来评价模型a预测的精确度。

12、步骤3中:平均绝对误差mae、相关系数r2及均方根误差rmse作为评价指标的具体表达式如下:

13、(1)

14、(2)

15、(3)

16、式(1)-(3)中,为样本量,为第i个样本的真实径向水平位移,为第i个样本的预测径向水平位移,为n个样本的真实径向水平位移的平均值。

17、步骤4具体为:根据shapley值对水压因子、温度因子及时效因子这三个影响因子进行排序,将其中shapley值小于0.02的影响因子进行剔除,将剔除后剩余的影响因子重新带入lightgbm模型构建起新的大坝变形预测模型b。

18、步骤5具体为:采用控制变量法调整步骤4获得的大坝变形预测模型b的三个核心参数学习速率、树的最大深度、最大叶子数,调整次,获得个大坝变形预测模型{b1,b2…bn},使用步骤3中的模型评价指标评价大坝变形预测模型{b1,b2…bn}的精度,同时满足r2最大,mae和rmse最小即为预测效果最好的模型c。

19、步骤6中:获得的瀑布图中条形框内的数字代表条形框一侧(左边)纵坐标影响因子对径向水平位移影响值的大小,数字前面的正负号代表影响的方向,加号代表影响方向为向上游,即使大坝的径向水平位移向上游发生移动;减号代表影响方向向下游,即使大坝的径向水平位移向下游发生移动;不同影响因子对大坝径向水平位移的影响进行叠加,即可得到最终的径向水平位移预测结果。

20、本专利技术的有益效果是:

21、本专利技术基于机器学习的大坝变形可解释预测方法可以更充分的发挥出人工智能算法的算力优势,有效提高了大坝变形的数据预测精度。并且通过shap可解释方法定量化解释机器学习模型的机理,通过对每一个影响因子对模型结果的影响来提高机器学习模型的可信度,为大坝变形可解释预测提供了新方法。

本文档来自技高网...

【技术保护点】

1.基于机器学习的大坝变形可解释预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于机器学习的大坝变形可解释预测方法,其特征在于,步骤1具体为:对大坝上的监测点进行连续监测获取大坝的径向水平位移数据及对应的水位、温度、时效的环境量数据,并对获取的大坝变形数据以及水压、温度、时效的环境量数据进行剔除粗差的预处理工作。

3.根据权利要求2所述的基于机器学习的大坝变形可解释预测方法,其特征在于,步骤2中,水压因子选取、、,表示月平均库水位、表示月平均库水位的二次方、表示月平均库水位的三次方;温度因子选取、、、、,表示监测日当天的平均温度、表示监测日前五天的平均温度、表示监测日前三十天的平均温度、表示监测日前六十天的平均温度、表示监测日前九十天的平均温度;时效因子选取、,为累计进行观测的天数除以100。

4.根据权利要求3所述的基于机器学习的大坝变形可解释预测方法,其特征在于,步骤3具体为:对步骤1预处理后的数据随机进行训练集及测试集的划分,其中80%作为训练集,20%作为测试集;将划分好的训练集带入到步骤2中确认好输入量及输出量的LightGBM模型中构建起大坝变形预测模型A,通过平均绝对误差MAE、相关系数R2及均方根误差RMSE作为模型评价指标来评价模型A预测的精确度。

5.根据权利要求4所述的基于机器学习的大坝变形可解释预测方法,其特征在于,步骤3中:平均绝对误差MAE、相关系数R2及均方根误差RMSE作为评价指标的具体表达式如下:

6.根据权利要求5所述的基于机器学习的大坝变形可解释预测方法,其特征在于,步骤4具体为:根据Shapley值对水压因子、温度因子及时效因子这三个影响因子进行排序,将其中Shapley值小于0.02的影响因子进行剔除,将剔除后剩余的影响因子重新带入LightGBM模型构建起新的大坝变形预测模型B。

7.根据权利要求6所述的基于机器学习的大坝变形可解释预测方法,其特征在于,步骤5具体为:采用控制变量法调整步骤4获得的大坝变形预测模型B的三个核心参数学习速率、树的最大深度、最大叶子数,调整次,获得个大坝变形预测模型{B1,B2…Bn},使用步骤3中的模型评价指标评价大坝变形预测模型{B1,B2…Bn}的精度,同时满足R2最大,MAE和RMSE最小即为预测效果最好的模型C。

8.根据权利要求7所述的基于机器学习的大坝变形可解释预测方法,其特征在于,步骤6中:获得的瀑布图中条形框内的数字代表条形框一侧纵坐标影响因子对径向水平位移影响值的大小,数字前面的正负号代表影响的方向,加号代表影响方向为向上游,即使大坝的径向水平位移向上游发生移动;减号代表影响方向向下游,即使大坝的径向水平位移向下游发生移动;不同影响因子对大坝径向水平位移的影响进行叠加,即可得到最终的径向水平位移预测结果。

...

【技术特征摘要】

1.基于机器学习的大坝变形可解释预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于机器学习的大坝变形可解释预测方法,其特征在于,步骤1具体为:对大坝上的监测点进行连续监测获取大坝的径向水平位移数据及对应的水位、温度、时效的环境量数据,并对获取的大坝变形数据以及水压、温度、时效的环境量数据进行剔除粗差的预处理工作。

3.根据权利要求2所述的基于机器学习的大坝变形可解释预测方法,其特征在于,步骤2中,水压因子选取、、,表示月平均库水位、表示月平均库水位的二次方、表示月平均库水位的三次方;温度因子选取、、、、,表示监测日当天的平均温度、表示监测日前五天的平均温度、表示监测日前三十天的平均温度、表示监测日前六十天的平均温度、表示监测日前九十天的平均温度;时效因子选取、,为累计进行观测的天数除以100。

4.根据权利要求3所述的基于机器学习的大坝变形可解释预测方法,其特征在于,步骤3具体为:对步骤1预处理后的数据随机进行训练集及测试集的划分,其中80%作为训练集,20%作为测试集;将划分好的训练集带入到步骤2中确认好输入量及输出量的lightgbm模型中构建起大坝变形预测模型a,通过平均绝对误差mae、相关系数r2及均方根误差rmse作为模型评价指标来评价模型a预测的精确度。

5.根据权利要求4所述的基于机器学习的大坝变形可解释预测方法,其特征在...

【专利技术属性】
技术研发人员:马春辉余飞程琳杨杰陆希
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1