基于NGBoost和SHAP值的可解释地震动参数概率密度分布预测方法技术

技术编号:28976124 阅读:20 留言:0更新日期:2021-06-23 09:20
本发明专利技术公开了基于NGBoost和SHAP值的可解释地震动参数概率密度分布预测方法,涉及地震工程技术领域,包括以下步骤:步骤1,确定研究区域,收集研究区域内地震事件波形和元数据信息,并进行分析处理,建立强震动数据库;步骤2,对强震动数据进行数据清洗,挑选用于机器学习模型训练的数据;步骤3,利用挑选的强震动记录和自然梯度提升算法,训练出用于地震动参数概率密度分布预测的机器学习模型;步骤4,计算所有样本所有特征的SHAP值,并根据SHAP值分析各个特征的重要性,以及如何影响地震动参数预测,解释机器学习模型;步骤5,利用训练好的机器学习模型,对新发生或假想地震的地震动参数概率密度分布进行预测。

【技术实现步骤摘要】
基于NGBoost和SHAP值的可解释地震动参数概率密度分布预测方法
本专利技术涉及地震工程
,具体为基于NGBoost和SHAP值的可解释地震动参数概率密度分布预测方法。
技术介绍
地震造成的人员伤亡和财产损失主要是由强地面运动引起的建筑结构的破坏和倒塌造成的。强地面运动也是滑坡等次生灾害的直接诱因。地震后,强地面运动参数(峰值加速度(PGA)、峰值速度(PGV)、峰值位移(PGD)和加速度反应谱(SA))的快速估算,可用于判定震后造成的损失,指导应急救援工作。地震前,对于危险断层上可能发生的假想地震产生的地震动的预测,可用于地震危险性概率分析,指导城市规划和重大工程(例如核电站、水库大坝、跨海大桥等)的设计和建设。计算或预测地震动参数的方法主要有三种:数值模拟、地震动预测方程(也常被称作地震动衰减关系)和机器学习。基于有限差分、有限元、谱元或有限体积等的数值模拟方法,具有明确物理意义,但高频地震波场的模拟需要巨大的计算量,以及精确的震源和地下速度结构模型。地震动预测方程形式明确,计算速度快,在地震动图以及概率地震危险性分析中通常使用这种方法。但现代地震动预测方程形式复杂,函数形式和特征变量的选取没有统一标准,具有很强的主观性,且无法考虑各项之前的非线性耦合作用。随着人工智能技术的发展,利用数据驱动的机器学习算法来预测地震动参数受到越来越多的重视。目前利用机器学习进行地震动参数预测的方法主要可以分为两类。一类是通过演化建模等方法获取可以进行地震动参数预测的函数方程式。与地震动预测方程不同,这类机器学习算法不需要预先假定泛函形式,函数方程通过学习获得。另一类机器学习方法是通过训练决策树、神经网络等模型进行地震动参数预测。但是目前这两类算法都存在一些问题:例如,学习地震动参数预测函数方程的方法,会为保证方程的合理性限制方程的复杂度,预测精度通常较低。基于决策树和神经网络(特别是深度学习)的方法,模型复杂,预测精度高,但是可解释性较差。并且目前用于地震动参数预测的机器学习方法无法给出预测结果的不确定度,而这对于后续的震后震害评估以及概率地震危险性分析来说更加重要。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供基于NGBoost和SHAP值的可解释地震动参数概率密度分布预测方法,为解决地震动参数预测结果的不确定度问题,提出采用自然梯度提升(NGBoost)算法。为解决地震动参数预测机器学习模型的可解释性问题,提出计算SHAP(SHapleyAdditiveexPlanations)值,来研究各个特征的重要性和如何影响预测结果,进行机器学习模型解释。本专利技术的目的是通过以下技术方案来实现的:基于NGBoost和SHAP值的可解释地震动参数概率密度分布预测方法,包括以下步骤:步骤1,确定研究区域,收集研究区域内地震事件波形和元数据信息,并进行分析处理,建立强震动数据库;步骤2,对强震动数据进行数据清洗,挑选用于机器学习模型训练的数据;步骤3,利用挑选的强震动记录和自然梯度提升算法,训练出用于地震动参数概率密度分布预测的机器学习模型;步骤4,计算所有样本所有特征的SHAP值,并根据SHAP值分析各个特征的重要性,以及如何影响地震动参数预测,解释机器学习模型;步骤5,利用训练好的机器学习模型,对新发生或假想地震的地震动参数概率密度分布进行预测。优选的,所述元数据信息包括矩震级Mw、震中距Rjb、地下30m平均S波速度VS30、断层顶部深度ZTOR、滑动角Rake、断层倾角Dip和VS达到2.5km/s时的深度Z2.5。优选的,所述地震动参数包括峰值加速度、峰值速度和峰值位移。优选的,所述步骤3中训练机器学习模型的基础学习器采用分类与回归树,评分规则采用对数分数。优选的,采用K-折交叉验证和网格搜索搜寻机器学习模型训练的最佳超参数。优选的,所述步骤4还包括以下内容:对于每个样本,计算每个特征i的SHAP值φi:其中M表示输入特征的个数;表示M个特征的所有排列组成的集合;表示在排列R中所有在特征i之前的特征组成的集合;fx(S)=E[f(X)|Xs=xS]表示已知特征子集S情况下的条件期望,根据计算的SHAP值,研究各个特征如何影响地震动参数预测,是否与物理规律相符,判断机器学习模型的合理性。本专利技术的有益效果是:1、通过引入自然梯度(NGBoost)算法实现了对地震动参数概率密度分布的预测。相比于预测值,地震动参数的概率密度分布对于后续地震危险性分析更加重要。2、通过计算SHAP值实现了机器学习模型解释,利用SHAP值可以研究各个特征如何影响地震动参数预测,评估机器学习模型的合理性。附图说明图1是本专利技术的流程图;图2是对于测试集数据,实际观测到的峰值加速度(PGA)与机器学习模型预测值的比较;图3是对于测试集数据,实际观测到的峰值速度(PGV)与机器学习模型预测值的比较;图4是对于测试集数据,实际观测到的峰值位移(PGD)与机器学习模型预测值的比较;图5是对于2009年美国加州地区的一次Mw4.45级地震,机器学习模型给出的峰值加速度(PGA)概率密度分布预测;图6是对于2009年美国加州地区的一次Mw4.45级地震,机器学习模型给出的峰值速度(PGV)概率密度分布预测;图7是对于2009年美国加州地区的一次Mw4.45级地震,机器学习模型给出的峰值位移(PGD)概率密度分布预测;图8是峰值加速度(PGA)预测机器学习模型的SHAP摘要图;图9是峰值速度(PGV)预测机器学习模型的SHAP摘要图;图10是峰值位移(PGD)预测机器学习模型的SHAP摘要图;具体实施方式下面结合附图进一步详细描述本专利技术的技术方案,但本专利技术的保护范围不局限于以下所述。如图1所示,本实施方式基于NGBoost和SHAP值的可解释地震动参数概率密度分布预测方法按照以下步骤实施:步骤一:确定研究区域,收集研究区域内地震事件波形和元数据信息,并进行分析处理,建立强震动数据库;根据需求,选定研究区域,利用研究区域内地震台网提供的地震目录,截取地震事件波形。若研究区域在国内,地震目录可采用《中国台网正式地震目录》,地震事件波形可根据地震目录从国家地震科学数据中心获取。若研究区域在国外,可采用国际地震中心(ISC)或美国地质调查局(USGS)提供地震目录,地震事件波形可从美国地震学研究联合会(IRIS)或当地地震台网网站下载。对于地震事件波形数据,只选取东西和南北分量。对地震波形数据进行去仪器响应、去均值、去趋势、基线校正和带通滤波处理(0.1~30Hz),并旋转两正交水平分量得到与观测仪器布设方向无关的非几何平均形式(RotD50),测量得到峰值加速度(PGA)、峰值速度(PGV)和峰值位移(PGD)。搜集相关文献资料,并分析得到强震动记录对应的震源、传播路径和场本文档来自技高网
...

【技术保护点】
1.基于NGBoost和SHAP值的可解释地震动参数概率密度分布预测方法,其特征在于,包括以下步骤:/n步骤1,确定研究区域,收集研究区域内地震事件波形和元数据信息,并进行分析处理,建立强震动数据库;/n步骤2,对强震动数据进行数据清洗,挑选用于机器学习模型训练的数据;/n步骤3,利用挑选的强震动记录和自然梯度提升算法,训练出用于地震动参数概率密度分布预测的机器学习模型;/n步骤4,计算所有样本所有特征的SHAP值,并根据SHAP值分析各个特征的重要性,以及如何影响地震动参数预测,解释机器学习模型;/n步骤5,利用训练好的机器学习模型,对新发生或假想地震的地震动参数概率密度分布进行预测。/n

【技术特征摘要】
1.基于NGBoost和SHAP值的可解释地震动参数概率密度分布预测方法,其特征在于,包括以下步骤:
步骤1,确定研究区域,收集研究区域内地震事件波形和元数据信息,并进行分析处理,建立强震动数据库;
步骤2,对强震动数据进行数据清洗,挑选用于机器学习模型训练的数据;
步骤3,利用挑选的强震动记录和自然梯度提升算法,训练出用于地震动参数概率密度分布预测的机器学习模型;
步骤4,计算所有样本所有特征的SHAP值,并根据SHAP值分析各个特征的重要性,以及如何影响地震动参数预测,解释机器学习模型;
步骤5,利用训练好的机器学习模型,对新发生或假想地震的地震动参数概率密度分布进行预测。


2.根据权利要求1所述的基于NGBoost和SHAP值的可解释地震动参数概率密度分布预测方法,其特征在于,所述元数据信息包括矩震级Mw、震中距Rjb、地下30m平均S波速度VS30、断层顶部深度ZTOR、滑动角Rake、断层倾角Dip和VS达到2.5km/s时的深度Z2.5。


3.根据权利要求1所述的基于NGBoost和SHAP值的可解释地震动参数概...

【专利技术属性】
技术研发人员:陈蒙王华
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1