基于主成分和Logistic分析地质灾害概率预报方法技术

技术编号:36072211 阅读:10 留言:0更新日期:2022-12-24 10:42
本发明专利技术涉及一种基于主成分和Logistic分析地质灾害概率预报方法,包括从雨量、信息量数据库中提取灾害点雨量因子,灾害点雨量因子选取地质灾害易发度和表征降水的6个因子,表征降水的6个因子选取表征降水量和降水连续性的当日降水、前期有效降水、降水日数、最长连续降水日数,最长连续降水量,前3日最大降水量;根据灾害点雨量因子和易发度信息量,建立二分类数据系列;通过主成分分析方法得到主成分,并确定主要影响因子;对不同的主成分和主要影响因子进行Logistic回归;检验参数对比;得到最优Logistic概率模型。本专利对因子显著性进行研究后再进行回归,更科学性,在模型的检验中,建立的模型相对于原模型,命中率能提高30%左右。30%左右。30%左右。

【技术实现步骤摘要】
基于主成分和Logistic分析地质灾害概率预报方法


[0001]本专利技术涉及一种基于主成分和Logistic分析地质灾害概率预报方法,属于气象研究的


技术介绍

[0002]降雨引发地质灾害预报技术主要分为两大类,一是统计方法,即通过大量的地质灾害样本研究降水和地质灾害发生概率或位移监测的关系,另一类是动力机理方法考虑地质体在降雨过程中自身动力变化过程而建立数学物理判据方程动力预报。相对而言,统计方法由于其更好的可操作性和实用性更多的应用于业务当中。统计方法常用的有多次回归,神经网络模型、贝叶斯法或频数法等,这些方法统计灾害发生前的降水,如降水累积量、降水持续时间和强度等,有的还考虑了地质灾害易发度,这些因子作为因变量,统计建立其与滑坡时间或规模的关系。Logistic回归方法在统计方法中由于其对因子无特殊要求及良好预警效果,在区域性及局地性的地质灾害预警都有较广的应用。
[0003]Logistic回归方法建立地质灾害概率模型中对因子选取较为主观,因子选择有降水类、地质地貌特征等,因子两个到二十多个不等,多数研究无相关的因子选取方法,导致模型运行慢,降低结果的参考价值。

技术实现思路

[0004]为了解决上述技术问题,本专利技术提供一种基于主成分和Logistic分析地质灾害概率预报方法,针对因子选择科学性进行研究,根据检验效果择优进行建模。在样本检验的基础上,针对样本外数据进行长时间系列检验,同时对比雨量检验模型和区域Logistic模型,检验效果更具有代表性,其具体技术方案如下:
[0005]一种基于主成分和Logistic分析地质灾害概率预报方法,包括以下步骤:
[0006]步骤1:从雨量、信息量数据库中提取灾害点雨量因子;
[0007]步骤2:提取地质灾害易发度;
[0008]步骤3:根据灾害点雨量因子和易发度信息量,建立二分类数据系列,建立二分类数据系列过程为将一部分灾情数据发生日往前推至未发生灾害日期,确定为未发生灾害的样本,同时剔除该条发生灾害的样本;
[0009]步骤4:通过主成分分析方法得到主成分,并确定主要影响因子;
[0010]步骤5:对不同的主成分进行Logistic回归;
[0011]步骤6:对主要影响因子进行Logistic回归;
[0012]步骤7:试验数据分为训练数据和检验数据,应用训练数据,通过步骤5、6建立模型,应用模型对检验数据进行预报,对实况的准确性检验,检验参数包括准确率和ROC曲线;
[0013]步骤8:比较建立模型的检验数据的准确率和ROC曲线,得到最优Logistic概率模型。
[0014]进一步的,所述步骤1中灾害点雨量因子选取地质灾害易发度和表征降水的6个因
子,表征降水的6个因子选取表征降水量和降水连续性的当日降水、前期有效降水、降水日数、最长连续降水日数,最长连续降水量,前3日最大降水量。
[0015]进一步的,在进行步骤3之前,首先,为保证因子的连续性,对表征降水的6个相关的因子进行正态化处理,其次,地质灾害易发度和表征降水的6个因子还存在属性和数量级的差异,需要对地质灾害易发度和表征降水的6个因子进行数据标准化处理。
[0016]进一步的,所述正态化处理的过程为:对表征降水的6个相关的因子进行开三次方根;
[0017]由于不同变量常具有不同的单位和不同的变异程度,不同单位常使系数的实践解释发生困难,为了消除量纲影响和变量自身变异大小和数值大小的影响,故需要对数据进行标准化。数据标准化处理的具体过程为:原始数据通过减去数据均值然后除以方差或标准差,这种数据标准化方法经过处理后数据符合标准正态分布,即均值为0,标准差为1,转化函数为:y

=(y

μ)/σ),式中y

表示处理后的标准化数据,y为处理处理前的原始数据,μ为地质灾害易发度和表征降水的6个因子的原始数据的均值,σ为地质灾害易发度和表征降水的6个因子的原始数据的方差或标准差。
[0018]进一步的,所述主成分分析方法是一种统计方法,将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中取出几个较少的综合变量,尽可能多地反映原来变量的信息,通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分,是数学上用来降维的一种方法,步骤4的具体过程为:
[0019]研究地质灾害发生与否与降水、地质灾害易发度的关系,根据累计贡献率来取主成分,使其特征值大于1,选取k个主成分,建立主成分F
k
,表示如下式:
[0020]F
k
=a
1k Z1+a
2k Z2+

+a
ij Z
i

+a
pk
Z
p
ꢀꢀꢀ
(1)
[0021]其中,Zi是原始变量经过标准化处理的值,a
ij
描述了因子i在第j个主成分中的因子得分系数,即第i个因子对第j个主成分的贡献,a
ij
与第j个主成分对应方差的贡献率E
j
的组合便是需要确定的第i个环境因子的权重值W
i
,表示如下式:
[0022][0023]进一步的,Logistic回归分析是一种广义的线性回归分析模型,是研究因变量为二分类的分类变量或某事件的发生率,比较常用的情形是探索某些致灾因素,根据危险因素预测灾害发生的概率,而地质灾害发生是降水、地质灾害易发度因素综合影响的结果,适合用Logistic模型进行概率预测;
[0024]Logistics回归方程为:
[0025][0026]p为发生概率,x为相关的自变量,Logistics回归用了两种方法,一种的自变量就是直接用地质灾害易发度和表征降水的6个因子中的前几个,另一种的自变量是分析而来的主成分,β为各个 x对应的系数,因为分子比分母小,且指数函数取值为正数,故p取0

1区间的数值。
[0027]进一步的,所述步骤7检验过程为:灾情以县为单位统计的,取县城周边20km的范围为预报值提取区,当地质灾害发生的概率大于60%时为地质灾害黄色以上级别预警,并
对社会发布,为了实现检验的量化,取灾情范围内的概率最大值和平均值作为检验的参量,当周边区域最大概率值大于等于60%为命中,小于60%为漏报,命中率和漏报率公式表达如下:
[0028]命中率:
[0029]漏报率:
[0030]式中,NA为预报正确次数,NC为漏报次数。
[0031]本专利技术的有益效果是:
[0032]本专利对华中地区用主成分方法分析诱发地质灾害的因子的基础上,设计不同变量进行 Logistic回归,建立地质灾害概率模型,以2019年灾情进行了检验,对比Logistic模型和降水统计模型检验结果进行评估。...

【技术保护点】

【技术特征摘要】
1.一种基于主成分和Logistic分析地质灾害概率预报方法,其特征在于:包括以下步骤:步骤1:从雨量、信息量数据库中提取灾害点雨量因子;步骤2:提取地质灾害易发度;步骤3:根据灾害点雨量因子和易发度信息量,建立二分类数据系列,建立二分类数据系列过程为将一部分灾情数据发生日往前推至未发生灾害日期,确定为未发生灾害的样本,同时剔除该条发生灾害的样本;步骤4:通过主成分分析方法得到主成分,并确定主要影响因子;步骤5:对不同的主成分进行Logistic回归;步骤6:对主要影响因子进行Logistic回归;步骤7:试验数据分为训练数据和检验数据,应用训练数据,通过步骤5、6建立模型,应用模型对检验数据进行预报,对实况的准确性检验,检验参数包括准确率和ROC曲线;步骤8:比较建立模型的检验数据的准确率和ROC曲线,得到最优Logistic概率模型。2.根据权利要求1所述的基于主成分和Logistic分析地质灾害概率预报方法,其特征在于:所述步骤1中灾害点雨量因子选取地质灾害易发度和表征降水的6个因子,表征降水的6个因子选取表征降水量和降水连续性的当日降水、前期有效降水、降水日数、最长连续降水日数,最长连续降水量,前3日最大降水量。3.根据权利要求2所述的基于主成分和Logistic分析地质灾害概率预报方法,其特征在于:在进行步骤3之前,首先,为保证因子的连续性,对表征降水的6个相关的因子进行正态化处理,其次,地质灾害易发度和表征降水的6个因子还存在属性和数量级的差异,需要对地质灾害易发度和表征降水的6个因子进行数据标准化处理。4.根据权利要求3所述的基于主成分和Logistic分析地质灾害概率预报方法,其特征在于:所述正态化处理的过程为:对表征降水的6个相关的因子进行开三次方根;数据标准化处理的具体过程为:原始数据通过减去数据均值然后除以方差或标准差,这种数据标准化方法经过处理后数据符合标准正态分布,即均值为0,标准差为1,转化函数为:y

=(y

μ)/σ),式中y

表示处理后的标准化数据,y为处理处理前的原始数据,μ为地质灾害易发度和表征降水的6个因子的原始数据的均值,σ为地质灾害易发度和表征降水的6个因子的原始数据的方差或标准差。5.根据权利要求3所述的基于主成分和Logistic分析地质灾害概率预报方法,其特征在于:所述主成分分析方法是一种统计方法,将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中取出几个较少的综...

【专利技术属性】
技术研发人员:许凤雯李宇梅宋巧云包红军狄靖月刘海知
申请(专利权)人:国家气象中心中央气象台
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1