当前位置: 首页 > 专利查询>山东大学专利>正文

一种细颗粒物空气污染成因分析方法及系统技术方案

技术编号:35919398 阅读:15 留言:0更新日期:2022-12-10 11:02
本发明专利技术属于空气污染成因分析技术领域,涉及一种细颗粒物空气污染成因分析方法及系统,对获取到的样点监测数据进行数据预处理,所述监测数据包括细颗粒物浓度和特征变量数据;利用训练好的机器学习模型对预处理好的数据进行处理,得到特征变量和细颗粒物浓度之间的数据关系;初步定性评估各特征变量对细颗粒物浓度的影响;对各特征变量进行部份依赖分析,确定特征变量对细颗粒物浓度的控制区间;提取细颗粒物浓度超过设定值的数据样本,并分成多个污染阶段,利用所述机器学习模型对所述数据样本进行处理,定量计算各污染阶段每个特征变量的具体贡献值;本发明专利技术可以实现对污染成因分析,有助于配置相应的治理方案。有助于配置相应的治理方案。有助于配置相应的治理方案。

【技术实现步骤摘要】
一种细颗粒物空气污染成因分析方法及系统


[0001]本专利技术属于空气污染成因分析
,涉及一种细颗粒物空气污染成因分析方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]长期暴露在空气污染的环境中会引发心血管、呼吸系统等疾病。为此,各个国家都非常重视治理大气污染问题。细颗粒物指环境空气中空气动力学当量直径小于等于2.5微米的颗粒物,又称为PM
2.5
,是环境污染重要的衡量指标,精确分析、量化影响PM
2.5
形成的驱动因素的贡献,以此来精准防治空气污染是十分必要和有意义的。
[0004]据专利技术人了解,以戈达德地球观测系统化学传输模型(GEOS

Chem)、天气研究与预报和社区多尺度空气质量模式(WRF

CMAQ)等为代表的传统化学输运模型常被用来研究空气污染。戈达德地球观测系统化学传输模型可以用来分析PM
2.5
成分空间变化的来源和过程,而天气研究与预报和社区多尺度空气质量模式可以计算气象条件、人为排放和异质化学对PM
2.5
的影响。但是由于排放清单、物理和化学参数的不确定性使得传统化学运输模型偏差较大。

技术实现思路

[0005]本专利技术为了解决上述问题,提出了一种细颗粒物空气污染成因分析方法及系统,本专利技术以机器学习算法为框架,打破机器学习模型“黑箱”的性质,利用排列重要性算法、部份依赖算法、沙普利加性解释算法等多种算法解释空气污染背后各种驱动因素的贡献,实现对污染成因分析,有助于配置相应的治理方案。
[0006]根据一些实施例,本专利技术采用如下技术方案:
[0007]一种细颗粒物空气污染成因分析方法,包括以下步骤:
[0008]对获取到的样点监测数据进行数据预处理,所述监测数据包括细颗粒物浓度和特征变量数据;
[0009]利用训练好的机器学习模型对预处理好的数据进行处理,得到特征变量和细颗粒物浓度之间的数据关系;
[0010]初步定性评估各特征变量对细颗粒物浓度的影响;
[0011]对各特征变量进行部份依赖分析,确定特征变量对细颗粒物浓度的控制区间;
[0012]提取细颗粒物浓度超过设定值的数据样本,并分成多个污染阶段,利用所述机器学习模型对所述数据样本进行处理,定量计算各污染阶段每个特征变量的具体贡献值。
[0013]作为可选择的实施方式,所述监测数据包括气态污染物数据、气象数据、离子数据、元素数据和碳数据。
[0014]作为可选择的实施方式,所述机器学习模型为随机森林模型,训练过程包括将预
处理后的数据随机分取一部分作为随机森林模型的训练集,另一部分用作模型的测试集,选用画学习曲线的模型调参方法对随机森林模型最为重要的n_estimators和max_depth两个参数进行调参,通过学习曲线逐步确定模型性能最佳时对应的决策树的数量和决策树的深度。
[0015]作为可选择的实施方式,还包括对训练后的机器学习模型进行评价,具体过程包括分别采用决定系数、平均绝对误差、均方根误差来评价随机森林模型测试集的结果精度。
[0016]作为可选择的实施方式,初步定性评估各特征变量对细颗粒物浓度的影响的具体过程为:机器学习模型依据排列重要性算法将每个特征对应的数据打乱,然后依据打乱后的模型进行训练预测;重复上述步骤多次,若在打乱数据集后,特征权重下降,且下降越多则代表该特征越重要,若基本不变则表示该特征对细颗粒物浓度基本没有影响。
[0017]作为可选择的实施方式,对各特征变量进行部份依赖分析,确定特征变量对细颗粒物浓度的控制区间的具体过程包括通过将指定因子的变化值分别控制在设定范围内,并将模型预测的污染物浓度的相应变化取平均值,确定若干个特征对预测结果的响应或协同响应关系,以此来评估特征变量对结果的敏感性。
[0018]作为可选择的实施方式,定量计算各污染阶段每个特征变量的具体贡献值的具体过程为使用沙普利加性解释算法计算每个特征在每个数据样本中对细颗粒物浓度的具体贡献值。
[0019]作为进一步的,将其他特征变量组成的特征矩阵放入机器学习模型计算每个特征在每个数据样本中对细颗粒物浓度的具体贡献值,重复多次后,将所有具体贡献值导出,每个空气污染阶段按照具体贡献值的平均绝对值排名,筛选出对细颗粒物浓度贡献大的前N个特征变量,并绘制出每一个空气污染阶段每一条数据样本中每个特征具体贡献值的时间序列,以此来判断每个特征在每个时间节点对细颗粒物浓度的贡献。
[0020]N为正整数。
[0021]一种细颗粒物空气污染成因分析系统,包括:
[0022]预处理模块,被配置为对获取到的样点监测数据进行数据预处理,所述监测数据包括细颗粒物浓度和特征变量数据;
[0023]模型处理模块,被配置为利用训练好的机器学习模型对预处理好的数据进行处理,得到特征变量和细颗粒物浓度之间的数据关系;
[0024]初步定性分析模块,被配置为初步定性评估各特征变量对细颗粒物浓度的影响;
[0025]偏依赖分析模块,被配置为对各特征变量进行部份依赖分析,确定特征变量对细颗粒物浓度的控制区间;
[0026]定量分析模块,被配置为提取细颗粒物浓度超过设定值的数据样本,并分成多个污染阶段,利用所述机器学习模型对所述数据样本进行处理,定量计算各污染阶段每个特征变量的具体贡献值。
[0027]一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行所述的方法中的步骤。
[0028]与现有技术相比,本专利技术的有益效果为:
[0029]本专利技术基于大气超级监测站数据,利用机器学习方法对影响空气污染的多种数据
因素进行深度挖掘,构建了特征变量与PM
2.5
浓度线性或非线性关系,并在此基础上对模型结果充分地进行可解释性分析。
[0030]本专利技术可以通过定性分析初步判断特征因子对空气污染的影响,还可以计算出两个特征对PM
2.5
的协同控制作用,以便区分出每个特征对PM
2.5
浓度的控制区间,从而实现对污染物的精准治理。
[0031]本专利技术还可以定量计算出特征因子对污染的具体贡献,为决策管理部门提供了一套较为详尽的以数据驱动为框架的空气污染成因分析思路。
附图说明
[0032]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0033]图1为本专利技术的流程示意图。
[0034]图2为本专利技术定量分析流程示意图。
具体实施方式
[0035]下面结合附图与实施例对本专利技术作进一步说明。
[0036]应该指出,以下详细说明都是例示性的,旨在对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种细颗粒物空气污染成因分析方法,其特征是,包括以下步骤:对获取到的样点监测数据进行数据预处理,所述监测数据包括细颗粒物浓度和特征变量数据;利用训练好的机器学习模型对预处理好的数据进行处理,得到特征变量和细颗粒物浓度之间的数据关系;初步定性评估各特征变量对细颗粒物浓度的影响;对各特征变量进行部份依赖分析,确定特征变量对细颗粒物浓度的控制区间;提取细颗粒物浓度超过设定值的数据样本,并分成多个污染阶段,利用所述机器学习模型对所述数据样本进行处理,定量计算各污染阶段每个特征变量的具体贡献值。2.如权利要求1所述的一种细颗粒物空气污染成因分析方法,其特征是,所述监测数据包括气态污染物数据、气象数据、离子数据、元素数据和碳数据。3.如权利要求1所述的一种细颗粒物空气污染成因分析方法,其特征是,所述机器学习模型为随机森林模型,训练过程包括将预处理后的数据随机分取一部分作为随机森林模型的训练集,另一部分用作模型的测试集,选用画学习曲线的模型调参方法对随机森林模型最为重要的n_estimators和max_depth两个参数进行调参,通过学习曲线逐步确定模型性能最佳时对应的决策树的数量和决策树的深度。4.如权利要求1或3所述的一种细颗粒物空气污染成因分析方法,其特征是,还包括对训练后的机器学习模型进行评价,具体过程包括分别采用决定系数、平均绝对误差、均方根误差来评价随机森林模型测试集的结果精度。5.如权利要求1所述的一种细颗粒物空气污染成因分析方法,其特征是,初步定性评估各特征变量对细颗粒物浓度的影响的具体过程为:机器学习模型依据排列重要性算法将每个特征对应的数据打乱,然后依据打乱后的模型进行训练预测;重复上述步骤多次,若在打乱数据集后,特征权重下降,且下降越多则代表该特征越重要,若基本不变则表示该特征对细颗粒物浓度基本没有影响。6.如权利要求1所述的一种细颗粒物空气污染成因分析方法,其特征是,对各特征变量进行部份依赖分析,确定特征变量对细颗粒...

【专利技术属性】
技术研发人员:汪先锋张庆竹王国强贾曼李田帅李磊牟江山
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1