基于随机森林与环境变量的土壤矿物结合态有机碳预测方法及装置制造方法及图纸

技术编号:36780487 阅读:11 留言:0更新日期:2023-03-08 22:13
本发明专利技术公开了一种基于随机森林与环境变量的土壤矿物结合态有机碳预测方法,包括将多个土壤样本的真实土壤矿物结合态有机碳含量及其相关的环境变量集合;基于递归特征消除算法筛选环境变量集合得到重要环境变量;将真实土壤矿物结合态有机碳含量以及对应的筛选环境变量集作为样本集,将样本集分为建模集和独立验证集;基于建模集训练初始随机森林预测模型得到随机森林预测模型;基于独立验证集采用决定系数和均方根误差评价随机森林预测模型的预测精度,当达到预测精度阈值获得最终随机森林预测模型;本发明专利技术还公开了一种基于随机森林与环境变量的土壤矿物结合态有机碳预测装置。置。置。

【技术实现步骤摘要】
基于随机森林与环境变量的土壤矿物结合态有机碳预测方法及装置


[0001]本专利技术属于土壤有机碳组分预测方法,尤其涉及一种基于随机森林与环境变量的土壤矿物结合态有机碳预测方法及装置。

技术介绍

[0002]大气中二氧化碳浓度的增加对地球产生了重大影响,因此我们迫切需要制定有效的策略来从大气中捕获二氧化碳。土壤有机碳库占陆地生态系统碳库的三分之二,其储存的有机碳超过比大气和植被碳库的总和,因此,将土壤有机碳封存被认为是捕获大气二氧化碳的自然气候解决手段之一。与此同时,土壤有机碳封存也有助于提高多种土壤功能和生态系统服务。促进和采用旨在增加土壤有机碳的土地管理实践需要深入了解土壤有机碳的形成、持久性和功能。
[0003]由于土壤有机碳由具有不同微生物分解行为的有机化合物组成,我们无法通过土壤有机碳总量来预测其对外界环境变化的响应。因此我们需要通过土壤有机碳分组方法来深入认知土壤有机碳的复杂性。目前将土壤有机碳划分颗粒态和矿物结合态有机碳的物理分组技术正在逐步受到土壤学界的重视。土壤颗粒态和矿物结合态有机碳在形成、持续和功能的机制上有着根本的不同。土壤颗粒态有机碳主要由植物中未分解的轻质碎片组成,平均周转周期小于10年,土壤有机碳总量的占比可从几个百分点到50%。土壤有机碳大部分为土壤矿物结合态有机碳,其主要由微生物和植物来源的高度分解有机物组成,平均周转周期从10年到100年不等。
[0004]尽管土壤颗粒态和矿物结合态有机碳在深入理解土壤有机碳演化具有重要意义,但它们很少记录在土壤数据库中,尤其是大规模研究存在严重不足。当土壤数据库缺失土壤有机碳组分数据时,常通过土壤转换函数进行预测。Lee和Viscarra Rossel(2020)(Lee,J.,Viscarra Rossel,R.A.,2020.Soil carbon simulation confounded by different pool initialisation.Nutrient Cycling in Agroecosystems,116(2),245

255.)成功通过拟合基于土壤黏粒和有机碳线性土壤转换函数预测了土壤碳组分数据。上述研究的不足在于:(1)土壤黏粒和有机碳含量不是土壤碳组分仅有的相关环境变量;(2)土壤有机碳演化过程复杂,土壤有机碳组分和环境变量往往呈现非线性交互,当前的线性回归模型存在严重不足。因此亟待开发更丰富环境变量结合非线性土壤转换函数的土壤矿物结合态有机碳预测模型。
[0005]随机森林是一种基于树结构的机器学习方法,能够很好处理非线性关系,且可以较好地避免模型过度拟合。

技术实现思路

[0006]本专利技术提供了一种基于随机森林与环境变量的土壤矿物结合态有机碳预测方法,该方法能够快速、准确的预测土壤矿物结合态有机碳含量。
[0007]一种基于随机森林与环境变量的土壤矿物结合态有机碳预测方法,包括:
[0008](1)获得多个土壤样本,将多个土壤样本的真实土壤矿物结合态有机碳含量作为土壤数据集,基于土壤样本空间位置通过土壤数据库和遥感数据产品库获得环境变量集合;
[0009](2)基于环境变量集合通过递归特征消除算法获得多组环境变量以及对应的随机森林模型精度,将最高的随机森林模型精度对应的一组环境变量作为重要环境变量;
[0010](3)将土壤数据集以及对应的筛选环境变量集作为样本集,将样本集分为建模集和独立验证集;获得初始随机森林预测模型,基于建模集采用十折交叉验证优化初始随机森林预测模型参数得到随机森林预测模型;基于独立验证集采用决定系数和均方根误差评价随机森林预测模型的预测精度,当达到预测精度阈值获得最终随机森林预测模型;
[0011](4)应用时,将待检测土壤样本的重要环境变量输入最终随机森林预测模型得到预测土壤矿物结合态有机碳。
[0012]所述将多个土壤样本的真实土壤矿物结合态有机碳含量作为土壤数据集,包括:
[0013]根据土地覆盖和分类图采集涵盖农田和林地的多个土壤样本,通过理化分析获得每个样本的真实土壤矿物结合态有机碳,多个样本的真实土壤矿物结合态有机碳构建土壤数据集。
[0014]基于土壤样本空间位置通过土壤数据库和遥感数据产品库获得环境变量,所述环境变量集合包括土壤变量、气候变量、生物变量和地形变量。
[0015]所述土壤变量包括土壤有机碳、全氮、全磷、全钾、阳离子交换量、砂粒、粉粒、黏粒、粉粒+黏粒、pH和土壤降雨侵蚀;
[0016]所述气候变量包括年降水、年均温、潜在蒸散量和大气氮沉降;
[0017]所述生物变量包括归一化植被指数、加强植被指数和净初级生产力;
[0018]所述地形变量为高程。
[0019]所述基于环境变量集合通过递归特征消除算法获得多组环境变量以及对应的随机森林模型精度,包括:
[0020]S1:基于环境变量集合拟合第一随机森林模型,从环境变量集合中去除单一环境变量后剩余的环境变量拟合第二随机森林模型,基于第一随机森林模型和第二随机森林模型通过交叉验证方法分别获得第一随机森林模型精度和第二随机森林模型精度,将第二随机森林模型精度与第一随机森林模型精度的差值作为对应去除单一环境变量的重要度,差值越大重要度越高,依次去除单一环境变量直到环境变量集中的每个环境变量均获得重要度;
[0021]S2:移除重要度最低的单一环境变量得到环境变量组合,环境变量组合拟合第三随机森林模型,从环境变量组合中去除单一环境变量后剩余的环境变量拟合第四随机森林模型,再次通过交叉验证方法分别获得第三、四随机森林模型精度,将第四随机森林模型精度与第三随机森林模型精度进行差值得到对应的去除单一环境变量重要度,依次去除单一环境变量直到环境变量组合中的每个环境变量均获得重要度;
[0022]S3:重复步骤S2,直到环境变量组合为单个环境变量停止重复,从而得到多组环境变量拟合的多个随机森林模型精度。
[0023]所述随机森林模型精度的评价指标为均方跟误差RMSE为:
[0024][0025]其中,n为样本个数,y
i
为第i个样本的实测矿物结合态有机碳含量,为第i个样本的通过随机森林模型生成的预测矿物结合态有机碳含量。
[0026]通过靴襻法生成多个与原训练样本集大小相同的数据集用于构建随机森林预测模型的多个决策树,在每个决策树中,将环境变量随机分为多个环境变量子集,通过随机划分环境变量子集构建每个决策树的结点分枝。
[0027]基于独立验证集采用决定系数和均方根误差评价随机森林预测模型的预测精度,所述决定系数R2为:
[0028][0029]所述均方跟误差RMSE为:
[0030][0031]其中,n为样本个数,y
i
为第i个样本的实测矿物结合态有机碳含量,为第i个样本的通过随机森林模型生成的预测矿物结合态有机碳含量。
[0032]一种基于随机森林与环境变量的土壤矿物结合态有机碳预测本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于随机森林与环境变量的土壤矿物结合态有机碳预测方法,其特征在于,包括:(1)获得多个土壤样本,将多个土壤样本的真实土壤矿物结合态有机碳含量作为土壤数据集,基于土壤样本空间位置通过土壤数据库和遥感数据产品库获得环境变量集合;(2)基于环境变量集合通过递归特征消除算法获得多组环境变量以及对应的随机森林模型精度,将最高的随机森林模型精度对应的一组环境变量作为重要环境变量;(3)将土壤数据集以及对应的筛选环境变量集作为样本集,将样本集分为建模集和独立验证集;获得初始随机森林预测模型,基于建模集采用十折交叉验证优化初始随机森林预测模型参数得到随机森林预测模型;基于独立验证集采用决定系数和均方根误差评价随机森林预测模型的预测精度,当达到预测精度阈值获得最终随机森林预测模型;(4)应用时,将待检测土壤样本的重要环境变量输入最终随机森林预测模型得到预测土壤矿物结合态有机碳。2.根据权利要求1所述的基于随机森林与环境变量的土壤矿物结合态有机碳预测方法,其特征在于,所述将多个土壤样本的真实土壤矿物结合态有机碳含量作为土壤数据集,包括:根据土地覆盖和分类图采集涵盖农田和林地的多个土壤样本,通过理化分析获得每个样本的真实土壤矿物结合态有机碳,多个样本的真实土壤矿物结合态有机碳构建土壤数据集。3.根据权利要求1所述的基于随机森林与环境变量的土壤矿物结合态有机碳预测方法,其特征在于,基于土壤样本空间位置通过土壤数据库和遥感数据产品库获得环境变量,所述环境变量集合包括土壤变量、气候变量、生物变量和地形变量。4.根据权利要求3所述的基于随机森林与环境变量的土壤矿物结合态有机碳预测方法,其特征在于,所述土壤变量包括土壤有机碳、全氮、全磷、全钾、阳离子交换量、砂粒、粉粒、黏粒、粉粒+黏粒、pH和土壤降雨侵蚀;所述气候变量包括年降水、年均温、潜在蒸散量和大气氮沉降;所述生物变量包括归一化植被指数、加强植被指数和净初级生产力;所述地形变量为高程。5.根据权利要求1所述的基于随机森林与环境变量的土壤矿物结合态有机碳预测方法,其特征在于,所述基于环境变量集合通过递归特征消除算法获得多组环境变量以及对应的随机森林模型精度,包括:S1:基于环境变量集合拟合第一随机森林模型,从环境变量集合中去除单一环境变量后剩余的环境变量拟合第二随机森林模型,基于第一随机森林模型和第二随机森林模型通过交叉验证方法分别获得第一随机森林模型精度和第二随机森林模型精...

【专利技术属性】
技术研发人员:陈颂超肖逸张祥林薛杰
申请(专利权)人:浙江大学杭州国际科创中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1