一种预测重金属剂量-形态-微生物效应的方法技术

技术编号:39575334 阅读:19 留言:0更新日期:2023-12-03 19:27
本发明专利技术涉及一种预测重金属剂量

【技术实现步骤摘要】
一种预测重金属剂量

形态

微生物效应的方法


[0001]本专利技术涉及环境
,特别涉及一种基于机器学习的预测重金属剂量

[0002]形态

微生物效应的方法


技术介绍

[0003]目前我国相关土壤管理标准主要基于国外模型和参数制定,因此迫切需要基于我国国情系统地开展土壤环境基准研究,支撑我国土壤环境管理

微生物作为土壤的重要组成部分,其生物量

多样性等指标反映着土壤的健康程度,从而可用以评估典型污染物如重金属对土壤环境的影响

影响重金属污染的微生物效应关系的因素既包括重金属剂量

形态,又涉及污染场景的特征例如气候条件

土壤类型

土壤性质等,且并非简单的线性关系

以往重金属剂量

形态

效应关系的研究主要基于实验室简单体系的模拟分析,很难外推到实际污染土壤,影响了土壤污染物环境基准的准确制定;且污染场景复杂多变,导致常规毒性评估研究的方法和结果结论不能有效地用于土壤重金属剂量

形态

效应复杂关系的阐释与精准预测模型的构建,制约了针对土壤重金属的环境基准的制定

相较于传统模型,机器学习对多因素

非线性的复杂关系具有更强的学习能力,能够模拟

预测复杂数据关


技术实现思路

[0004]本专利技术的目的在于提供一种基于机器学习的预测重金属剂量

形态

微生物效应的方法,能够实现快速

准确的预测重金属对微生物的影响,为重金属的评估与管理提供指导

为达成上述目的,本专利技术的解决上述技术问题的方案如下:
[0005]一种预测重金属剂量

形态

微生物效应的方法,其特征在于,包括如下步骤:
[0006]S1
基于公开发表文献筛选包含典型重金属剂量

形态

微生物效应的数据并构建数据集;
S2
针对数据集,确定用于机器学习的模型输入的关键特征,所述关键特征为影响重金属的微生物效应的因素,包括气候条件

土壤性质

重金属剂量与形态;确定模型输出,所述模型输出为表征微生物效应的指标,并对数据预处理;所述表征微生物效应的指标分别为总微生物量碳,总微生物量氮,
Shannon
指数
、Chao1
指数四种微生物效应,分别用以训练不同的机器学习模型;
[0007]S3
利用网格搜索法确定建立各项输出所对应的机器学习模型的最佳参数,同时针对收集数据特点,构建交叉验证方法;
[0008]S4
利用交叉验证基于
S3
确定的参数训练模型,基于测试集预测值与观测值之间的相关系数与对称平均绝对百分比误差评估模型,得到基于机器学习的重金属剂量

形态

微生物效应最优模型;
[0009]S5
使用采集样本所得实测微生物效应数据验证模型的可靠性

[0010]进一步地,所述步骤
S1
包括:
[0011]S1.1
确定检索关键词包含“重金属污染”、“微生物”概念,收集重金属剂量

形态

微生物效应相关文献;
[0012]S1.2
对检索到的相关文献进行筛选,筛选标准为文献应该至少提供完整的地理信息

重金属种类

剂量及对应的至少一种微生物效应;
[0013]进一步地,所述步骤
S2
中:所述气候条件:海拔

年均温

培养温度

年均降水量

采样点信息;所述土壤性质包括深度
、pH、
总氮

有效氮

总磷

有效磷

总钾

有效钾

总碳

总有机碳

总有机质

阳离子交换量;所述重金属剂量与形态包括铜











汞的剂量及形态

[0014]S2.2
对数据集进行预处理,保留
S2.1
所述特征集,并根据采样点位置,利用土壤数据库

气候数据库对缺失值进行插补;
[0015]进一步地,所述采样点信息包括是否场地

是否自然土地

是否耕地

是否受场地影响

[0016]进一步地,所述形态包括总态和有效态

[0017]进一步地,所述预测变量分别为总微生物量碳,总微生物量氮,
Shannon
指数
、Chao1
指数四种微生物效应,分别用以训练不同的随机森林模型

[0018]进一步地,所述机器学习模型为随机森林模型,所述步骤
S3
的具体步骤包括:
[0019]S3.1
使用网格搜索法针对不同输出分别确定随机森林最佳参数
mtry

maxnodes
,其中
mtry
为构建决策树分支时随机抽样的变量个数,
maxnodes
为构建单棵决策树所允许的最大节点个数,两个参数控制着模型的拟合程度;
[0020]S3.2
构建适用于收集数据的交叉验证方法以防止常规的十折交叉验证法导致模型过拟合问题,方法为:缩减训练集体量,从各文献中抽取
20
%样本作为训练集,其余
80
%样本作为测试集评估模型,重复多次建模

[0021]进一步地,所述步骤
S4
的具体步骤包括:
[0022]S4.1
基于
S3.1
所确定的最优参数与
S3.2
所述交叉验证方法,将训练集输入模型进行拟合训练;
[0023]S4.2

S3.2
所得模型对测试集进行预测,基于测试集预测值与观测值之间的相关系数
(R2)
与对称平均绝对百分比误差
(sMAPE)
评估模型性能
,
定义分别如下:
[0024][0025]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种预测重金属剂量

形态

微生物效应的方法,其特征在于,包括如下步骤:
S1
基于公开发表文献筛选包含典型重金属剂量

形态

微生物效应的数据并构建数据集;
S2
针对数据集,确定用于机器学习的模型输入的关键特征,所述关键特征为影响重金属的微生物效应的因素,包括气候条件

土壤性质

重金属剂量与形态;确定模型输出,所述模型输出为表征微生物效应的指标,并对数据预处理;所述表征微生物效应的指标分别为总微生物量碳,总微生物量氮,
Shannon
指数
、Chao1
指数四种微生物效应,分别用以训练不同的机器学习模型;
S3
利用网格搜索法确定建立各项输出所对应的机器学习模型的最佳参数,同时针对收集数据特点,构建交叉验证方法;
S4
利用交叉验证基于
S3
确定的参数训练模型,基于测试集预测值与观测值之间的相关系数与对称平均绝对百分比误差评估模型,得到基于机器学习的重金属剂量

形态

微生物效应最优模型;
S5
使用采集样本所得实测微生物效应数据验证模型的可靠性
。2.
根据权利要求1所述的预测重金属剂量

形态

微生物效应的方法,其特征在于,所述步骤
S1
包括:
S1.1
确定检索关键词,所确定的关键词包含“重金属污染”、“微生物”概念,收集重金属剂量

形态

微生物效应相关文献;
S1.2
对检索到的相关文献进行筛选,筛选标准为文献应该至少提供完整的地理信息

重金属种类

剂量及对应的至少一种微生物效应
。3.
根据权利要求1所述的预测重金属剂量

形态

微生物效应的方法,其特征在于,所述步骤
S2
中:所述气候条件:海拔

年均温

培养温度

年均降水量

采样点信息;所述土壤性质包括深度
、pH、
总氮

有效氮

总磷

有效磷

总钾

有效钾

总碳

总有机碳

总有机质

【专利技术属性】
技术研发人员:胡献刚于福波穆莉邓鹏
申请(专利权)人:农业农村部环境保护科研监测所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1