一种应用于气候变化情景下区域未来植被指数的预估方法技术

技术编号:25551469 阅读:60 留言:0更新日期:2020-09-08 18:51
本发明专利技术涉及一种应用于气候变化情景下区域未来植被指数的预估方法,首先进行特征变量初步选取,之后生成样本,进行模型关键参数设置;通过Python调用Sklearn机器学习库中随机森林模型,输入样本数据S进行模型训练;然后,进行随机森林模型预报性能评估;SDSM预报因子筛选;SDSM模型率定与验证;构造随机森林模型的预报因子集;最后将生成的预报因子集输入到训练好的随机森林模型中进行气候变化影响下的未来植被指数预估。本发明专利技术能够针对未来不同气候变化情景,对区域未来植被指数进行预估。

【技术实现步骤摘要】
一种应用于气候变化情景下区域未来植被指数的预估方法
本专利技术涉及生态环境质量评估领域,特别是一种应用于气候变化情景下区域未来植被指数的预估方法。
技术介绍
当前全球气候正经历以变暖为主要特征的显著变化,IPCC第五次评估报告指出,1880-2012年全球地表平均温度升高0.85℃。相关研究均指出温度、降水等气象变量是影响植被生长发育的重要环境因子,而植被指数反映植被生长状态,是表征区域生态环境质量的重要指标。目前,关于气候变化与植被指数的研究更多的集中于两者间响应关系研究,研究侧重点在于历史数据,而关于未来植被指数预估方法的研究目前尚属空白。随着气候变化研究的不断深入,如今已有成熟的技术手段对未来不同气候情景的气象变量进行定量预估。同时随着机器学习方法日渐成熟,目前已能提供一种相对准确的变量预估手段。在此基础上,构建气候变化情景下区域未来植被指数的预估方法已成为可能。
技术实现思路
有鉴于此,本专利技术的目的是提供一种应用于气候变化情景下区域未来植被指数的预估方法,能够针对未来不同气候变化情景,对区域未来植被指数进行预估。本专利技术采用以下方案实现:一种应用于气候变化情景下区域未来植被指数的预估方法,包括以下步骤:步骤S1:特征变量初步选取:获取影响年度植被指数的特征变量,包括反应气候状况的年平均气温、年降水量、年蒸发量、反应地表下垫面的人口密度、GDP空间分布、土地利用、土壤数据、高程和坡度,数据形式均为栅格数据;其中,所述年平均气温、年降水量、年蒸发量统称为气象变量;步骤S2:将特征变量与植被指数统一转换为栅格数据;然后,由ArcGIS的RastertoAscii工具将栅格数据转换为Ascii码;再由Python调用Numpy库读取Ascii码数据,由Pandas库将读取的数据构建成随机森林模型的样本集S,如式(1):式中:为反应气候状况的特征变量,为反应地表下垫面的特征变量,Yi为预测变量;n为样本容量;j为反应气候状况的特征变量个数;k为反应地表下垫面的特征变量个数;步骤S3:随机森林模型关键参数设置:随机森林算法需要设置决策树数目ntree与节点分割时随机选取的特征变量数mtry两个关键参数;在计算机性能充足的情况下,ntree设置大值ntree∈[100,+∞),mtry设置为m表示特征变量总个数,即步骤S2中的j+k;步骤S4:训练样本:通过Python调用Sklearn机器学习库中随机森林模型,输入样本集S进行模型训练,得到训练好的随机森林模型;步骤S5:特征变量确定:由随机森林模型计算各特征变量的重要性评分,利用式(2)进行评分计算,选取评分结果排名前50%的变量作为预估植被指数的特征变量,特征变量中的气象变量通过SDSM降尺度模型进行预估;式中:EerrOOB1为袋外数据误差;EerrOOB2为随机对袋外数据所有特征变量的样本加入噪声干扰再次计算的袋外误差;ntree为决策树数目。步骤S6:进行随机森林模型预报性能评估;步骤S7:构造随机森林模型的预报因子集S*;步骤S8:未来植被指数预估:将步骤S10生成的预报因子集S*输入到步骤S4训练好的随机森林模型中进行气候变化影响下的未来植被指数预估。进一步地,步骤S5中所述特征变量中的气象变量通过SDSM降尺度模型进行预估的具体包括以下步骤:步骤Sa:根据预报因子与预报量有强相关性即相关系数大于0.8,预报因子间必须是弱相关或无关即相关系数小于0.3的原则,从气候模式数据中筛选出部分气候因子作为预报因子;步骤Sb:SDSM模型率定与验证:选取同期的气象站点实测数据与气候模式数据,建立每个站点气象变量与气候模式数据中筛选出的预报因子之间的经验统计关系,即确定多元回归方程的参数,进行模型参数的率定,其中降水采用式(3),气温、蒸发气象变量采用式(4);以确定性系数R2与均方根误差RMSE作为评价指标,利用同期历史气象观测资料对SDSM模式输出结果进行误差检验;式中:Wi为第i天发生降水的概率;α、β、γ为模式参数;Ri为降水量;Vi为气温、蒸发气象变量;ei为误差;Pij为预报因子;步骤Sc:未来气象变量预报:根据率定完成的SDSM降尺度模型ru式(3)与式(4),输入GCM气候模式数据,生成未来气象变量的逐日数据。进一步地,所述步骤S6的具体内容为:由平均百分误差MAPE、平均绝对误差MAE、均方根误差RMSE、确定性系数R2和解释方差得分explained_varance进行模型预报性能评估;其中,R2与explained_varance越大则表示模型的拟合效果越好;MAPE、MAE、RMSE越小则表示模型模拟精度越高;若模型模拟精度过低,则返回步骤S2增加样本数量,并对模型关键参数ntree与mtry进行调试;式中,Oi为实测值;Si为模拟值;n为数据长度;为实测系列数据的平均值;为模拟系列数据的平均值。进一步地,所述步骤S7的具体内容为:将步骤Sc预报的各气象站点2020-2100年的气象变量数值,通过Kriging插值生成预报区域的栅格数据;然后,由RastertoAscii工具将栅格数据转换为Ascii码,反应地表下垫面的土地利用、高程、坡度等因子保持不变;最后,通过Python调用Numpy库读取Ascii码文件,由Pandas库将读取数据构造成预报因子集S*;式中:为预估的未来气象变量,为反应地表下垫面的特征变量;n为样本容量;j*为反应气候状况的特征变量个数;k为反应地表下垫面的特征变量个数。与现有技术相比,本专利技术具有以下有益效果:本专利技术能够针对未来不同气候变化情景,对区域未来植被指数进行预估。附图说明图1为本专利技术实施例的流程图。图2为本专利技术实施例的栅格数据生成样本示意图。具体实施方式下面结合附图及实施例对本专利技术做进一步说明。应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。如图1、2所示,本实施例提供一种应用于气候变化情景下区域未来植被指数的预估方法,包括以下步骤:步骤S1:特征变量初步选取:根据植被学、生态学、气象学原理初步确定影响年度植被指数的特征变量,包括反应气候状况的年平均气温、年降水量、年蒸发量,反应地表下垫面的人口密度、GDP空间分布、土地利用、土壤数据、高程和坡度本文档来自技高网
...

【技术保护点】
1.一种应用于气候变化情景下区域未来植被指数的预估方法,其特征在于:/n包括以下步骤:/n步骤S1:特征变量初步选取:获取影响年度植被指数的特征变量,包括反应气候状况的年平均气温、年降水量、年蒸发量,反应地表下垫面的人口密度、GDP空间分布、土地利用、土壤数据、高程和坡度,数据形式均为栅格数据;其中,所述年平均气温、年降水量、年蒸发量统称为气象变量;/n步骤S2:将特征变量与植被指数统一转换为栅格数据;然后,由ArcGIS的Raster toAscii工具将栅格数据转换为Ascii码;再由Python调用Numpy库读取Ascii码数据,由Pandas库将读取的数据构建成随机森林模型的样本集S,如式(1):/n

【技术特征摘要】
1.一种应用于气候变化情景下区域未来植被指数的预估方法,其特征在于:
包括以下步骤:
步骤S1:特征变量初步选取:获取影响年度植被指数的特征变量,包括反应气候状况的年平均气温、年降水量、年蒸发量,反应地表下垫面的人口密度、GDP空间分布、土地利用、土壤数据、高程和坡度,数据形式均为栅格数据;其中,所述年平均气温、年降水量、年蒸发量统称为气象变量;
步骤S2:将特征变量与植被指数统一转换为栅格数据;然后,由ArcGIS的RastertoAscii工具将栅格数据转换为Ascii码;再由Python调用Numpy库读取Ascii码数据,由Pandas库将读取的数据构建成随机森林模型的样本集S,如式(1):



式中:为反应气候状况的特征变量,为反应地表下垫面的特征变量,Yi为预测变量;n为样本容量;j为反应气候状况的特征变量个数;k为反应地表下垫面的特征变量个数;
步骤S3:随机森林模型关键参数设置:随机森林算法需要设置决策树数目ntree与节点分割时随机选取的特征变量数mtry两个关键参数;在计算机性能充足的情况下,ntree设置大值,ntree∈[100,+∞),mtry设置为m表示特征变量总个数,即步骤S2中所述的j+k;
步骤S4:训练样本:通过Python调用Sklearn机器学习库中随机森林模型,输入样本集S进行模型训练,得到训练好的随机森林模型;
步骤S5:特征变量确定:由随机森林模型计算各特征变量的重要性评分,利用式(2)进行评分计算,选取评分结果排名前50%的的变量作为预估植被指数的特征变量,特征变量中的气象变量通过SDSM降尺度模型进行预估;



式中:EerrOOB1为袋外数据误差;EerrOOB2为随机对袋外数据所有特征变量的样本加入噪声干扰再次计算的袋外误差;ntree为决策树数目。
步骤S6:进行随机森林模型预报性能评估;
步骤S7:构造随机森林模型的预报因子集S*;
步骤S8:未来植被指数预估:将步骤S10生成的预报因子集S*输入到步骤S4训练好的随机森林模型中进行气候变化影响下的未来植被指数预估。


2.根据权利要求1所述的一种应用于气候变化情景下区域未来植被指数的预估方法,其特征在于:步骤S5中所述特征变量中的气象变量通过SDSM降尺度模型进行预估的具体包括以下步骤:
步骤Sa:进行SDSM预报因子筛选:根据预报因子与预报量有强相关性即相关系数大于0.8,预报因子间必须...

【专利技术属性】
技术研发人员:夏继勇高学珑蒋艳君王文奎陈奕蔡辉艺牟宇峰
申请(专利权)人:福州市规划设计研究院
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1