【技术实现步骤摘要】
基于机器学习的稻田甲烷排放量预测方法
[0001]本专利技术涉及环境
,特别涉及一种基于机器学习的稻田甲烷排放量预测方法。
技术介绍
[0002]稻田甲烷减排对于将升温阈值保持在2℃以下至关重要,但其排放在全球呈现出较高的空间异质性,受到气候变量、土壤性质、人为管理措施等因素的综合影响,使用环境以及管理指标准确估算稻田甲烷排放有助于更好地应对全球气候变化。甲烷排放量主要通过田间实验的方法测量或基于过程的模型计算,前者消耗大量人力物力,后者在应用到具体站点时要对模型进行校正和参数修改;随着机器学习等方法的出现,它能够处理多变量与标签的关系,同时做出快速准确预测,通过对数据集的筛选和模型参数的调整,能达到较好的预测效果,但是在稻田甲烷排放的应用较少。
技术实现思路
[0003]本专利技术的目的在于克服现有技术的不足和填补空白,提供一种基于机器学习的估计稻田甲烷排放量的方法,能够实现对稻田甲烷季节排放量的模拟预测。
[0004]为解决上述技术问题,本专利技术的技术方案:基于机器学习的稻田甲烷排放量预测 ...
【技术保护点】
【技术特征摘要】
1.基于机器学习的稻田甲烷排放量预测方法,其特征在于,包括如下步骤:步骤S1:建立稻田甲烷排放数据库;步骤S2:数据预处理,具体步骤包括:S2.1划分训练集和测试集;根据实验持续时间进行分层抽样;S2.2数值属性的标准化,对数值数据进行标准化来特征缩放,使得数据均值为0且分布具有单位方差;进行标准化的属性包括:实验持续时间、经度、纬度、年平均温度、平均年降水量、土壤容重、粘粒含量、土壤总氮、土壤有机碳、土壤C/N、土壤pH、生物炭施用、粪肥施用、绿肥施用、无机氮施用量共15个数值属性;标准化公式如下:其中,x为原数值,x
′
为标准化后的数值属性,μ为数值属性的均值,σ为标准差;S2.3分类属性数字化,要作为机器算法的输入,需要对分类属性进行数字化,使用one
‑
hot编码为每个类别创建一个二进制的属性,具体使用Scikit
‑
Learn的OneHotEncoder编码器来实现;进行one
‑
hot编码的属性包括轮作方式、是否耕作、秸秆还田方式、灌溉方式共4个分类属性;步骤S3:使用随机森林、支持向量机、XGBoost、神经网络算法将处理后的数据集输入模型进行训练,并分别调节这四种模型的超参数使其达到准确度要求,得到预测稻田甲烷排放的机器学习模型;所述步骤S3具体步骤包括:S3.1使用Scikit
‑
Learn训练随机森林、支持向量机、XGBoost,使用Keras训练两层全连接神经网络;S3.2网格搜索法在训练集上选择模型超参数,10折交叉验证评估需要进行实验的超参数值的所有组合,根据验证集上的分数得到最佳估算器,然后在整个训练集上重新训练;S3.3在测试集上评估模型作为泛化误差的近似,首先使用训练集得到的转换数据的方法对转换测试集的数据,然后评估模型在测试集上的性能,评估指标包括相关系数R2和均方根误差RMSE;R2=ρ
X,Y
其中,X表示实际值,Y表示预测值;步骤S4:根据调参结束的模型进行10折交叉验证,得到模型的预测结果;步骤S5:在所有数据上拟合模型,得到最终模型。2.根据权利要求1所述的基于机器学习的稻田甲烷排放量预测方法...
【专利技术属性】
技术研发人员:李润桐,穆莉,胡献刚,邓鹏,
申请(专利权)人:农业农村部环境保护科研监测所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。