地区生态和谐随机森林预测方法技术

技术编号:35471428 阅读:16 留言:0更新日期:2022-11-05 16:17
地区生态和谐随机森林预测方法,包括以下步骤:1、综合不同时间尺度,从地下到地表对山水林田湖草要素精细描述;2、结合长时段卫星遥感分时段对近百年的自然要素做精细定量解译;3、收集研究区范围内,不同年份人类要素表征数据;4、通过多元回归及机器学习的方法,建立人类活动要素函数;5、分析曲线的周期与频率,用数学模型预测未来各个要素的变化特点,预测人类活动对其他要素的影响。本发明专利技术具有极好的准确率;能够有效地运行在大数据集上;能够处理具有高维特征的输入样本,而且不需要降维;能够评估各个特征在分类问题上的重要性;在生成过程中,能够获取到内部生成误差的一种无偏估计;对于缺省值问题也能够获得很好得结果。对于缺省值问题也能够获得很好得结果。对于缺省值问题也能够获得很好得结果。

【技术实现步骤摘要】
地区生态和谐随机森林预测方法


[0001]本专利技术属于生态环境预测
,具体涉及一种地区生态和谐随机森林预测方法。

技术介绍

[0002]分析某城市的人地系统,并根据对其环境承载力的估计,可以作为生态和谐型立体城市进行规划。基于本项技术,可以进一步通过自然科学与社会科学在人文、社会、管理等领域的交叉,要充分分析人类活动对其干扰,利用社会科学评价方法的办法融入社会效益进行二次评价。根据当地经济发展需求及不同利益方诉求,人居环境等要素,结合可预测的经济社会学模型,优选出最完善的规划组合提供给规划人员,同时提出分年度的用地策略及具体修复措施。因此,如何提高地区生态和谐的预测效率和预测精准度是当下急需解决的问题。

技术实现思路

[0003]本专利技术为了解决现有技术中的不足之处,提供一种地区生态和谐随机森林预测方法;其根据地球历史上长期和快速的环境变化证据提供了与现代进行比较关键基线,探索用直观定量的数学模型分析自然系统关系,借助跨越了地质时间尺度和人类时间尺度的高精度测年技术,使解决连接人类历史和地质历史,抽象人类要素对山水林田湖草系统的干扰要素和关系,运用人工智能算法实现对其高精度的还原与预测。
[0004]为解决上述技术问题,本专利技术采用如下技术方案:地区生态和谐随机森林预测方法,包括以下步骤:第一步、针对多重要素,综合不同时间尺度,从地下到地表对山水林田湖草要素精细描述;第二步、结合长时段卫星遥感分时段对近百年的自然要素做精细定量解译,自然要素包括山、水、林、田、湖、草的面积,以1年为时间单位标定,综合解译人类要素,人类要素包括建筑用地面积;第三步、收集研究区范围内,不同年份人类要素表征数据,表征数据包括人口数量、GDP和工业开发强度,以1年为时间单位标定,综合解译人类要素;第四步、根据历史资料和专家判断,收集研究年限内对研究区的环境承载能力做出判断,并作为后续模型训练的标准。通过多元回归及机器学习的方法,建立人类活动要素函数;基于系统性思维,通过多元回归及机器学习的方法建立起人与自然多要素多尺度的拟合关系,多尺度包括时间尺度,探讨自然环境自发演化过程及人类活动对这一过程的影响,拟合成一个跟时间相关的数学模型,数学模型即曲线函数;第五步、通过将时间设定为未来的某个时间,分析曲线的周期与频率,用数学模型预测未来各个要素的变化特点,预测人类活动对其他要素的影响;基于上述工作提出环境承载力下限,划定该地区山、水、林、田、湖、草的面积或比例,划定生态功能保障基线、环境
质量安全底线、自然资源利用上线,指导生态和谐型城市立体规划。
[0005]第一步具体为:在重点解剖区布置密集浅钻,通过对地下地质体精细定量表征,建立包括山水林田湖草要素的三维空间模型;利用多个钻孔,结合高精度测年技术,从全新世晚期(>5000a),按照千年级划分,到1000年前开始以100年为时间单位标定,精细恢复古地理,古环境格局,最终建立精度较高的四维时空地质模型。
[0006]第四步中的多元回归及机器学习的方法为随机森林模型算法,随机森林模型算法的地理区域情况要素指标如下表所示:表1 地理区域情况要素指标假设数据收集年份为两个时段,第一个时段全新世中晚期至现代(7000 B.C

1950),共50个时间点,第二个时段1951

2021,共71个时间点,第一个时段主要用来构建地质演化背景, 1951

2020年该地区可作为生态和谐型立体城市进行规划的评判结果已知(1:可以作为;0:不可以作为),2021年的评判结果未知,是需要通过训练后的预测模型进行预测的;表1中共有23个指标,所以标准化后的Z矩阵大小是23*120,其对应的评判结果Y矩阵大小为120*1;待预测年份2021年的已知指标Z
2021
矩阵大小为23*1。
[0007]随机森林模型算法采用表1中参数进行数据清理例如处理缺失值、光滑噪声、识别
或删除离群点以及归一化进行数据预处理;包括以下步骤:(1)随机数生成,模型中的每棵树的生长为关键步骤、(2)计算预测指标MAE和MAPE、(3)随机森林参数优化、(4)根据准确率最高的原则,选择出最优模型、(5)根据随机森林生成的最优模型直接计算各特征的权重(非零实数),并根据由大到小的原则选择一定数目的较为重要的特征。
[0008]步骤(1)包括以下三个主要步骤:A、bootstrap 采样:若训练集大小为N,对于每棵树随机且有放回地从训练集中的抽取n个训练样本作为该树的训练集;B、特征随机:若每个样本的特征维度为M,指定一个常数m<<M,随机从M个特征中选取m个特征子集,每次树进行分裂时从这m个特征中选择最优的;C、每棵树都尽最大程度的生长,并且没有剪枝过。
[0009]步骤(2)具体为:为结果的真实值为结果的估计值。预测指标MAE(Mean Absolute Error)表示平均绝对误差,值域:[0,+∞);当预测值与真实值完全吻合时等于0,即完美模型;误差越大,MAE 值越大:预测指标MAPE(Mean Absolute Percentage Error)表示平均绝对百分比误差,值域:[0,+∞);当预测值与真实值完全吻合时等于0,即完美模型;误差越大,MAE 值越大:。
[0010]步骤(3)具体为:使用机器学习中经典调参方法,对建立树的个数、最大特征的选择方式、树的最大深度、节点最小分裂所需样本个数、叶子节点最小样本数、是否随机选择最合适的参数组合、是否贝叶斯优化进行调整。
[0011]采用上述技术方案,本专利技术具有以下技术效果:从空间角度对构成某一地区(如城市)的自然资源和人类居住环境的各种地理要素的基本情况的反映,可以看为是地理信息根据不同的需求,在感知、统计和分析三种不同深度处理后得到的信息。本方法中关于建立起人与自然多要素多尺度(时间尺度)的拟合关系是核心要解决的问题。
[0012]参照(马万钟,杜清运.地理国情监测的体系框架研究[J].国土资源科技管理,2011,28(06):104

111)的研究,可以将归纳为自然环境要素、社会人文要素和产业经济要素。参考(刘凯. 生态脆弱型人地系统演变与可持续发展模式选择研究[D].山东师范大学,2017)中提出的指标体系原则,以某一地区可作为生态和谐型立体城市进行规划为目标。通过采用自然环境、经济社会2个要素的指标采用随机森林的方法进行预测模型的建立,进一步获得指标对预测结果影响的权重分析。
[0013]对于表1中所列的指标,可进行适当的补充或删减,特征纳入越多,准确率越高。尽量保留权重大的指标需要保留,可减少特征可降低运行时间,建议按照95%阈值选择的部分重要特征的数据集。对于采集时间,同一年可进行多个时间点的采集,比如每月一个数据
点,使得样本量大大增加。增加样本量可增加预测模型的准确率。
[0014]随机森林分类效果(错误率)与两个因素有关:森林中任意两棵树的相关本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.地区生态和谐随机森林预测方法,其特征在于:包括以下步骤:第一步、针对多重要素,综合不同时间尺度,从地下到地表对山水林田湖草要素精细描述;第二步、结合长时段卫星遥感分时段对近百年的自然要素做精细定量解译,自然要素包括山、水、林、田、湖、草的面积,以1年为时间单位标定,综合解译人类要素,人类要素包括建筑用地面积;第三步、收集研究区范围内,不同年份人类要素表征数据,表征数据包括人口数量、GDP和工业开发强度,以1年为时间单位标定,综合解译人类要素;第四步、根据历史资料和专家判断,收集研究年限内对研究区的环境承载能力做出判断,并作为后续模型训练的标准;通过多元回归及机器学习的方法,建立人类活动要素函数;基于系统性思维,通过多元回归及机器学习的方法建立起人与自然多要素多尺度的拟合关系,多尺度包括时间尺度,探讨自然环境自发演化过程及人类活动对这一过程的影响,拟合成一个跟时间相关的数学模型,数学模型即曲线函数;第五步、通过将时间设定为未来的某个时间,分析曲线的周期与频率,用数学模型预测未来各个要素的变化特点,预测人类活动对其他要素的影响;基于上述工作提出环境承载力下限,划定该地区山、水、林、田、湖、草的面积或比例,划定生态功能保障基线、环境质量安全底线、自然资源利用上线,指导生态和谐型城市立体规划。2.根据权利要求1所述的地区生态和谐随机森林预测方法,其特征在于:第一步具体为:在重点解剖区布置密集浅钻,通过对地下地质体精细定量表征,建立包括山水林田湖草要素的三维空间模型;利用多个钻孔,结合高精度测年技术,从全新世晚期(>5000a),按照千年级划分,到1000年前开始以100年为时间单位标定,精细恢复古地理,古环境格局,最终建立精度较高的四维时空地质模型。3.根据权利要求1所述的地区生态和谐随机森林预测方法,其特征在于:第四步中的多元回归及机器学习的方法为随机森林模型算法,随机森林模型算法的地理区域情况要素指标如下表所示:表1 地理区域情况要素指标
假设数据收集年份为两个时段,第一个时段全新世中晚期至现代(7000 B.C

1950),共50个时间点,第二个时段1951

2021,共71个时间点,第一个时段主要用来构建地质演化背景, 1951

2020年该地...

【专利技术属性】
技术研发人员:王涛杨凯越
申请(专利权)人:中国地质科学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1