一种基于制造技术

技术编号:39896994 阅读:4 留言:0更新日期:2023-12-30 13:10
本发明专利技术公开了一种基于

【技术实现步骤摘要】
一种基于XGBoost和SHAP模型解释重金属环境因素定量分析方法


[0001]本专利技术涉及数据分析
,具体是一种基于
XGBoost

SHAP
模型解释重金属环境因素定量分析方法


技术介绍

[0002]随着过去几十年的快速城市化和工业化,土壤中的重金属污染已成世界范围内的环境和公共卫生问题

重金属具有很强的稳定性和毒性
,
可以通过自然过程或人为输入在环境介质中积累和转移,威胁农产品质量

生态安全和人类健康

土壤污染具有多源

跨介质和复合途径特征,重金属在土壤中的迁移和累积过程受到多种环境因素的影响

因此,明确土壤重金属累积的环境因素及其贡献率

了解环境因素对重金属含量的影响,对制定污染防治措施具有重要意义

[0003]现有的土壤重金属污染的分析方法,例如相关性分析

聚类分析

地统计分析和主成分分析,假设来自于同一污染源的重金属之间具有较强的相关性,可以通过识别具有相似数据分布特征,来定性判定重金属潜在来源

然而,这些方法对于空间信息欠缺考虑

对重金属污染源的分析缺少环境因素的贡献率量化以及对分析结果无法解释


技术实现思路

[0004]针对上述缺陷,本专利技术提出了一种基于
XGBoostr/>和
SHAP
模型解释重金属环境因素定量分析方法,目的在于解决现有的土壤重金属污染的分析方法对于空间信息欠缺考虑

对重金属污染源的分析缺少环境因素的贡献率量化以及对分析结果无法解释的问题

[0005]为达此目的,本专利技术采用以下技术方案:
[0006]一种基于
XGBoost

SHAP
模型解释重金属环境因素定量分析方法,包括以下步骤:
[0007]步骤
S1
:对研究目标区域进行土壤采样,获取土壤样品;
[0008]步骤
S2
:对所述土壤样品进行化学分析,获得所述土壤样品中重金属浓度数据;
[0009]步骤
S3
:对所述土壤样品中重金属浓度数据进行空间特征分析,获得环境因素的空间信息参数;
[0010]步骤
S4
:根据所述土壤样品中重金属浓度数据和环境因素的空间信息参数,利用极限梯度提升算法
(XGBoost)
模型和可解释机器学习
(SHAP)
模型计算得到所述土壤样品中重金属环境因素定量分析结果

[0011]优选地,在步骤
S1
中,具体包括以下子步骤:
[0012]步骤
S11
:确定所述研究目标区域的范围与所述土壤样品的采样方法;
[0013]步骤
S12
:根据所述研究目标区域的范围和所述土壤样品的采样方法,获取所述土壤样品

[0014]优选地,在步骤
S1
中,还包括以下步骤:获取所述研究目标区域的重金属源解析辅助数据

[0015]优选地,在步骤
S2
中,具体包括以下子步骤:
[0016]步骤
S21
:将所述土壤样品进行风干研磨过筛处理,得到第一土壤样品;
[0017]步骤
S22
:对所述第一土壤样品进行消解处理,得到第二土壤样品;
[0018]步骤
S23
:利用电感耦合等离子体

质谱
(ICP

MS)
测定所述第二土壤样品的重金属浓度数据

[0019]优选地,在步骤
S3
中,具体包括以下步骤:
[0020]采用克里金法,以所述研究目标区域作为分布点位,并以所述分布点位作为重金属浓度插值,以得到空间分布特征

[0021]优选地,在步骤
S3
中,还包括以下步骤:
[0022]利用
Arcgis
计算所述研究目标区域中重金属浓度插值

[0023]优选地,在步骤
S4
中,具体包括以下子步骤:
[0024]步骤
S41
:对所述土壤样品中重金属浓度数据进行描述性统计,得到所述研究目标区域中的重金属基本特征信息;
[0025]步骤
S42
:以所述土壤样品中重金属浓度数据和环境因素的空间信息参数作为
XGBoost
模型的输入,得到环境因素对重金属的贡献信息;
[0026]步骤
S43
:使用
SHAP
模型探究所述土壤样品中重金属浓度数据的程度变化趋势,并分析得到关键环境因素影响的边界与阈值;
[0027]步骤
S44
:将所述研究目标区域中的重金属基本特征信息

所述环境因素对重金属的贡献信息

以及所述关键环境因素影响的边界与阈值作为所述土壤样品中重金属环境因素定量分析结果

[0028]本申请实施例提供的技术方案可以包括以下有益效果:
[0029]本方案中通过
XGBoost
模型和
SHAP
模型计算得到的土壤样品中重金属环境因素定量分析结果,以确定各种污染源对重金属的贡献率,明确各环境因素对重金属污染的贡献率和重要度,并且探究环境因素对重金属污染影响程度变化趋势

此外,对空间信息参数和各形式的环境变量对相关性数据进行扩充,评估了关键环境变量对重金属污染的影响范围与程度,进而实现了土壤污染信息的全面性和完整性,为后期的环境治理提供了帮助

附图说明
[0030]图1是本专利技术实施例提供的基于
XGBoost

SHAP
模型解释重金属环境因素定量分析方法的步骤流程图;
[0031]图2是本专利技术实施例提供的
XGBoost
模型中环境变量的贡献率;
[0032]图3是本专利技术实施例提供的
SHAP
模型中每个变量的
SHAP
值及其整体参数;
[0033]图4是本专利技术实施例提供的关键环境因素的部份依赖图

具体实施方式
[0034]下面详细描述本专利技术的实施方式,实施方式的示例在附图中示出,其中,相同或类似的标号自始至终表示相同或类似的元件或具有相同或类似功能的元件

下面通过参考附图描述的实施方式是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制
。本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于
XGBoost

SHAP
模型解释重金属环境因素定量分析方法,其特征在于:包括以下步骤:步骤
S1
:对研究目标区域进行土壤采样,获取土壤样品;步骤
S2
:对所述土壤样品进行化学分析,获得所述土壤样品中重金属浓度数据;步骤
S3
:对所述土壤样品中重金属浓度数据进行空间特征分析,获得环境因素的空间信息参数;步骤
S4
:根据所述土壤样品中重金属浓度数据和环境因素的空间信息参数,利用极限梯度提升算法
(XGBoost)
模型和可解释机器学习
(SHAP)
模型计算得到所述土壤样品中重金属环境因素定量分析结果
。2.
根据权利要求1所述的一种基于
XGBoost

SHAP
模型解释重金属环境因素定量分析方法,其特征在于:在步骤
S1
中,具体包括以下子步骤:步骤
S11
:确定所述研究目标区域的范围与所述土壤样品的采样方法;步骤
S12
:根据所述研究目标区域的范围和所述土壤样品的采样方法,获取所述土壤样品
。3.
根据权利要求1所述的一种基于
XGBoost

SHAP
模型解释重金属环境因素定量分析方法,其特征在于:在步骤
S1
中,还包括以下步骤:获取所述研究目标区域的重金属源解析辅助数据
。4.
根据权利要求1所述的一种基于
XGBoost

SHAP
模型解释重金属环境因素定量分析方法,其特征在于:在步骤
S2
中,具体包括以下子步骤:步骤
S21
:将所述土壤样品进行风干研磨过筛处理,得到第一土壤样品;步骤
S22
:对所述第一土壤样品进行消解处理,得到第二土壤样品...

【专利技术属性】
技术研发人员:王鹏赵灵智罗树华肖荣波
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1