一种Bagging滑坡预报方法技术

技术编号:27395673 阅读:49 留言:0更新日期:2021-02-21 14:05
本发明专利技术公开了一种Bagging滑坡预报方法,具体按照以下步骤实施:步骤1、采用核主成分分析法进行滑坡成灾因子选取;步骤2、利用步骤1得到的数据构建基于Bagging的滑坡地质灾害预报模型;步骤3、采用XGBoost优化Bagging算法,完成滑坡预报。解决了现有技术中存在的精确度低的问题。低的问题。低的问题。

【技术实现步骤摘要】
一种Bagging滑坡预报方法


[0001]本专利技术属于滑坡位移预测
,涉及一种Bagging滑坡预报方法。

技术介绍

[0002]地质灾害是在自然演变或人为因素的影响下,对人民生命财产有极大危害的自然现象,包括地震、泥石流、滑坡、崩塌、火山岩浆爆发等。我国幅员辽阔,地形条件复杂多样,尤其在山区等地,地质构造运动剧烈,同时由于居民对山区的改建等不合理的人类活动,地质灾害频繁发生。根据 2009-2018年我国灾害发生的相关数据的分类统计,国内滑坡灾害占总发生量的65%,因此预测滑坡灾害的发生是非常有必要的。我国对滑坡灾害的研究起步虽晚,但也已经取得不错的成果。但从已有的研究成果来看,多数研究人员选取了单一模型预测,存在精确度较低等问题。

技术实现思路

[0003]本专利技术的目的是提供一种Bagging滑坡预报方法,解决了现有技术中存在的精确度低的问题。
[0004]本专利技术所采用的技术方案是,一种Bagging滑坡预报方法,具体按照以下步骤实施:
[0005]步骤1、采用核主成分分析法进行滑坡成灾因子选取;
[0006]步骤2、利用步骤1得到的数据构建基于Bagging的滑坡地质灾害预报模型;
[0007]步骤3、采用XGBoost优化Bagging算法,完成滑坡预报。
[0008]本专利技术的特点还在于:
[0009]步骤1具体按照以下实施:通过核主成分分析法来筛选滑坡灾害的主要影响因子,对因子的重要性进行排序与选择,减少了模型训练中的时间及步数;由于高维空间中成灾因子的选取是一个非线性的问题,KPCA方法由于算法简单、重构误差较小且易解决非线性问题等优势,成为降维筛选的一种有效方法;筛选过程如下:
[0010]假设样本集:X={x1,x2,

x
M
},其中x
k
∈R
N
为列向量;M为样本总数。
[0011]协方差矩阵如式(1)所示。
[0012][0013]其中,为满足的非线性映射。
[0014]对C进行特征分解:令λv=Cv;其中特征向量v是由组成的空间。
[0015]当所有特征值λ≥0时,得到式(2)的表达式:
[0016][0017]式中:k=1,2,

,M,v
r
为的线性组合:
[0018][0019]定义M
×
M维矩阵K,定义内积为式中i,j=1,2,

,M,将式(1)和式(2)带入式(3)得:
[0020]Mλ
r
c
r
=Kc
r
ꢀꢀꢀ
(4)
[0021]其中,Mλ
r
和c
r
是对应于K的特征值和特征向量。求得样本在特征向量的投影:
[0022][0023]式中,r=p,p+1,

,M,g(x)为对应于的非线性主元分量,所有投影形成一个矢量;
[0024]求解g(x)时,利用Mercer定理,使用核函数:
[0025][0026]代替空间的点积运算,则:
[0027][0028]当的均值不为0时,空间样本变为
[0029]将研究数据归一化后采用KPCA方法进行筛选。筛选步骤如下:
[0030]①
输入样本初始化,通过核函数式(6)计算矩阵K;
[0031]②
求解矩阵K/M的特征值λ1,λ2,


m
及特征向量α1,α2,


m

[0032]③
选取与最大特征值对应的特征向量与输入的属性进行计算,得到主成分;
[0033]由KPCA计算的特征值及主成分贡献率,按照式(9)、式(10)计算各成分的贡献率及累计贡献率;
[0034][0035][0036]步骤2具体按照以下实施:
[0037]假定最初的训练样本集为D={(x1,y1),(x2,y2),...,(x
n
,y
n
)};
[0038]其中,n为训练样本的个数;
[0039]训练阶段:
[0040]①
从训练样本集中随机提取m个作为输入;
[0041]②
根据提前设定的学习算法得出模型h
t

[0042]③
训练样本被放回;集合{h1,h2,...,h
t
}被返回;
[0043]其中t=1,2,,T,T为Bagging集成算法中包含的所有个体数目:
[0044]预测阶段:
[0045]①
回归问题:使用平均方法进行预测
[0046][0047]②
分类问题:使用投票方式进行预测
[0048][0049]集成分类器内部首先通过支持向量机对训练子集进行训练,得到不同的分类器,最后使用投票的方式进行融合从而输出结果;从而进行Bagging集成算法建模。
[0050]步骤2中Bagging集成算法建模过程:
[0051]①
集成学习中样本是通过随机抽样的形式来选取的,训练样本的选取对于Bagging算法的预测性能具有极大的影响,训练样本的质量会影响到弱分类器模型的准确度,训练样本种类会影响强分类器模型的准确率。
[0052]②
设置参数迭代次数T,训练集库选用处理后的最优样本,确定样本数量N。
[0053]③
弱分类器进行选取,将多个SVM模型作为弱分类器,每次迭代的时候,训练样本集将会被提取出来,个数为n,其最大为N。
[0054]④
对其进行判断,如果其迭代次数达到设定的要求,则得到T个弱分类器并退出,否则返回


[0055]⑤
按照对应分类器分别得出对应的分类结果,进行加权求得结果,根据测试集对于结果进行性能评估,不断进行循环得到最优解或者达到设置的迭代次数的上限时停止循环。
[0056]步骤3具体按照以下实施:
[0057]梯度提升决策树是结合Boosting与决策树的一种算法,对比于传统的提升算法Boosting,其使用贪心策略去代替Boosting中的错误样本分类权值分配的迭代,训练的方向朝着损失函数梯度下降的方向来达到最好的效果,最终通过加权求和的方法求得最后的预测结果;XGBoost是GBDT的优化算法,不仅对于损失函数进行了改进,而且对于损失函数采用二阶泰勒定理进行展开求解,增加了正则化防止过拟合,同时也降低了模型的复杂度;
[0058]为了避免过拟合,将正则化加入到损失函数中,通过结构风险最小化求得最优模型来构造目标函数:
[0059][0060]式中,i:样本的索引符号;I:样本的总量;Y
i
:训练样本的实际值;
[006本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种Bagging滑坡预报方法,其特征在于,具体按照以下步骤实施:步骤1、采用核主成分分析法进行滑坡成灾因子选取;步骤2、利用步骤1得到的数据构建基于Bagging的滑坡地质灾害预报模型;步骤3、采用XGBoost优化Bagging算法,完成滑坡预报。2.根据权利要求1所述的一种Bagging滑坡预报方法,其特征在于,所述步骤1具体按照以下实施:通过核主成分分析法来筛选滑坡灾害的主要影响因子,对因子的重要性进行排序与选择,减少了模型训练中的时间及步数;由于高维空间中成灾因子的选取是一个非线性的问题,KPCA方法由于算法简单、重构误差较小且易解决非线性问题等优势,成为降维筛选的一种有效方法;筛选过程如下:假设样本集:X={x1,x2,

x
M
},其中x
k
∈R
N
为列向量;M为样本总数,协方差矩阵如式(1)所示;其中,为满足的非线性映射;对C进行特征分解:令λv=Cv;其中特征向量v是由组成的空间;当所有特征值λ≥0时,得到式(2)的表达式:式中:k=1,2,

,M,v
r
为的线性组合:定义M
×
M维矩阵K,定义内积为式中i,j=1,2,

,M,将式(1)和式(2)带入式(3)得:Mλ
r
c
r
=Kc
r
ꢀꢀꢀꢀꢀꢀ
(4)其中,Mλ
r
和c
r
是对应于K的特征值和特征向量;求得样本在特征向量的投影:式中,r=p,p+1,

,M,g(x)为对应于的非线性主元分量,所有投影形成一个矢量;求解g(x)时,利用Mercer定理,使用核函数:代替空间的点积运算,则:当的均值不为0时,空间样本变为将研究数据归一化后采用KPCA方法进行筛选;筛选步骤如下:

输入样本初始化,通过核函数式(6)计算矩阵K;

求解矩阵K/M的特征值λ1,λ2,


m
及特征向量α1,α2,


m


选取与最大特征值对应的特征向量与输入的属性进行计算,得到主成分;由KPCA计算的特征值及主成分贡献率,按照式(9)、式(10)计算各成分的贡献率及累计贡献率;贡献率;3.根据权利要求2所述的一种Bagging滑坡预报方法,其特征在于,所述步骤2具体按照以下实施:假定最初的训练样本集为D={(x1,y1),(x2,y2),...,(x
n
,y
n
)};其中,n为训练样本的个数;训练阶段:

从训练样本集中随机提取m个作...

【专利技术属性】
技术研发人员:李丽敏张明岳温宗周郭伏陈曙东张俊何洋魏雄伟
申请(专利权)人:西安工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1