当前位置: 首页 > 专利查询>陇东学院专利>正文

一种基于地理信息的污染物在线监测系统技术方案

技术编号:32117043 阅读:25 留言:0更新日期:2022-01-29 19:02
本发明专利技术公开的一种基于地理信息的污染物在线监测系统,是一种改进的集成学习方法S

【技术实现步骤摘要】
一种基于地理信息的污染物在线监测系统


[0001]本专利技术属于计算机领域和地理信息领域的交叉融合,具体的,涉及一种基于地理信息的污染物在线监测系统。

技术介绍

[0002]随着经济规模的不断扩大和城市化进程的加快,对能源和资源的需求不断增长,我国大气污染问题日益突出,呈现出以PM2.5和O3为特征污染物的区域大气复合污染特征。众多研究表明,人为或自然排放的颗粒物(PM)是造成我国北方大气污染的主要原因之一,更是造成雾霾天气的主要污染物。受区域气候、气象条件、排放量空间分布和地形条件等综合因素影响,各地区大气污染特征及污染成因差异明显,运用观测和数值模拟的方法,研究区域大气污染成因是科学制定污染减排措施、持续改进环境空气质量的基础。
[0003]近年来,随着人工智能技术的逐步成熟,机器学习模型在学习复杂问题上已经取得了巨大的成功,多数机器学习模型应用在空气污染物浓度预测研究工作中,但是由于空气污染物浓度具有非平稳性的特点,导致使用单一的机器学习模型无法得到较为准确的预测结果并且模型的预测缺乏稳定性。集成学习方法思想的提出解决了单一模型预测准确性和稳定性低的问题,集成学习方法主要是生成大量的基础学习器并通过集成策略对基础学习器的输出结果进行集成。虽然集成学习可以有效地提升模型预测的准确性和稳定性,但是当大量参与集成的基础学习器预测结果相似时,会导致模型的预测性能提升效果不佳;同时若选择性能较差的集成策略对基础学习器的结果进行集成,也会对模型的预测结果有一定的影响。利用集成学习方法进行建模可以得到准确性较高的预测结果,但是集成学习模型多数都是“黑盒模型”,即给出模型的输入得到与之对应的输出,并没有任何的依据可以证明得到的输出是可信的。这使得大多数人对于集成模型的预测结果产生质疑,使得集成预测模型的应用饱受争议。

技术实现思路

[0004]为解决当前机器学习模型进行空气污染物预测时的问题,本专利技术请求保护一种基于地理信息的污染物在线监测系统,其特征在于,包括:
[0005]数据分析与预处理模块,用于描述研究数据,完成数据分析,进行数据预处理,执行特征工程;
[0006]模型建立模块,基于S

MStacking集成学习方法构建预测模型,生成并选择基础学习器,集成所述基础学习器;
[0007]分析评价模块,完成MEIC清单模拟结果分析、本地清单模拟结果分析并获取污染物空间分布特征。
[0008]进一步地,上述数据分析与预处理模块,用于描述研究数据,完成数据分析,进行数据预处理,执行特征工程,还包括:
[0009]上述描述研究数据获取获温度、露点、湿度、风向、风速和气压和天气条件的逐时
数据;
[0010]在建模之前需要将两部分数据合并在同一个数据集中,其中以两个数据集中相同的特征意义的“Date”和“Time”为关键字,以行为单位按照列合并数据集,将缺少的数据用空值代替,同时将数据集中无关的特征删除,得到最终特征为PM2.5、PM10、NO2、SO2、O3和CO 的逐时浓度以及Temperature、Dew Point、Humidity、Wind Speed和Pressure的逐时数据;
[0011]上述完成数据分析包括基于季节的数据分析、基于小时的数据分析、数据相关性分析;
[0012]所述进行数据预处理包括数据清洗,数据归一化;
[0013]所述执行特征工程包括特征构建和特征选择。
[0014]进一步地,上述模型建立模块,基于S

MStacking集成学习方法构建预测模型,生成并选择基础学习器,集成所述基础学习器,还包括:
[0015]基础学习器的生成,通过交叉验证的思想对训练集数据进行划分,针对每个训练子集分别用不同的基础学习算法训练得到多个基础学习器;
[0016]基础学习器选择,利用K

Means聚类方法对生成的多个基础学习器进行聚类,然后从聚类结果中删减部分相似性较强的基础学习器形成新的基础学习器集合,最后基于多目标蝙蝠算法MOBA选择部分基础学习器参与最终集成;
[0017]基础学习器集成,基于传统的Stacking集成策略对元学习器的输入特征进行特征重构得到改进集成策略MStacking,采用MStacking集成策略对参与最终集成的基础学习器进行集成。
[0018]进一步地,上述分析评价模块,完成MEIC清单模拟结果分析、本地清单模拟结果分析并获取污染物空间分布特征,还包括:
[0019]所述MEIC清单模拟结果分析包括基准情景和控制情景下PM10浓度对比,基准情景和控制情景下PM2.5浓度对比,MEIC清单基准情景与控制情景下日均值变化;
[0020]所述本地清单模拟结果分析包括基准情景和控制情景下PM10浓度对比,基准情景和控制情景下PM2.5浓度对比,本地化清单基准情景与控制情景下日均值变化;
[0021]所述获取污染物空间分布特征包括利用本地化排放源清单模拟的基准情景和控制情景下的颗粒物空间分布进行对比分析。
[0022]本专利技术公开的一种改进的集成学习方法S

MStacking,通过交叉验证的思想将训练数据集划分为多个训练子集,依次利用训练子集训练得到多个基础学习器;然后利用改进选择集成方法对参与集成的基础学习器进行选择;利用多目标优化算法MOBA在新的基础学习器集合中选择参与最终集成的基础学习器;利用改进Stacking集成策略MStacking对选择出基础学习器进行集成。基于S

MStacking集成方法建立空气污染物浓度预测模型,以PM2.5浓度为预测目标,设置单一模型对比实验和不同集成方法对比实验验证本文提出的改进的集成方法的有效性,表明利用所提出的方法构建的模型在预测准确性和稳定性上都有一定程度的提升。
附图说明
[0023]为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对
范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0024]图1为本专利技术所涉及的一种基于地理信息的污染物在线监测系统的结构模块图;
[0025]图2为本专利技术所涉及的一种基于地理信息的污染物在线监测系统各模块的工作流程图。
具体实施方式
[0026]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0027]参照附图1和2,本专利技术请求保护一种基于地理信息的污染物在线监测系统,其特征在于,包括:
[0028]数据分析与预处理模块,用于描述研究数据,完成数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于地理信息的污染物在线监测系统,其特征在于,包括:数据分析与预处理模块,用于描述研究数据,完成数据分析,进行数据预处理,执行特征工程;模型建立模块,基于 S

MStacking 集成学习方法构建预测模型,生成并选择基础学习器,集成所述基础学习器;分析评价模块,完成MEIC 清单模拟结果分析、本地清单模拟结果分析并获取污染物空间分布特征。2.如权利要求1所述的一种基于地理信息的污染物在线监测系统,其特征在于,上述数据分析与预处理模块,用于描述研究数据,完成数据分析,进行数据预处理,执行特征工程,还包括:上述描述研究数据获取获温度、露点、湿度、风向、风速和气压和天气条件的逐时数据;在建模之前需要将两部分数据合并在同一个数据集中,其中以两个数据集中相同的特征意义的“Date”和“Time”为关键字,以行为单位按照列合并数据集,将缺少的数据用空值代替,同时将数据集中无关的特征删除,得到最终特征为 PM2.5、PM10、NO2、SO2、O3 和 CO 的逐时浓度以及 Temperature、Dew Point、Humidity、Wind Speed 和 Pressure 的逐时数据;上述完成数据分析包括基于季节的数据分析、基于小时的数据分析、数据相关性分析;所述进行数据预处理包括数据清洗,数据归一化;所述执行特征工程包括特征构建和特征选择。3.如权利要求1所述的一种基于地理信息的污染物在线监测系统,其特征在于,上述模型建立模块,基于 S

【专利技术属性】
技术研发人员:唐兆民唐启师唐鑫钊王玉玲
申请(专利权)人:陇东学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1