一种基于双模型的空气质量空间推断方法及系统技术方案

技术编号:33478091 阅读:15 留言:0更新日期:2022-05-19 00:53
本发明专利技术公开了一种基于双模型的空气质量空间推断方法及系统,该方法包括构建网格划分子模型,根据空气质量数据采集源触发的污染事件对全局空间进行网格分类;构建特征选择模型,根据全局空间内所有时空单元的多源特征和局部时空单元对应的已知空气质量数据选择最优空气质量特征;利用最优空气质量特征和对应的已知空气质量数据构成数据集训练空气质量空间推断模型;利用训练后的空气质量空间推断模型根据全局空间内所有时空单元的多源特征推断各个时空单元对应的空气质量数据。本发明专利技术极大提高了模型的鲁棒性和准确性,并且推断网格高值和污染事件相对应,对污染溯源提供了坚实的模型基础。实的模型基础。实的模型基础。

【技术实现步骤摘要】
一种基于双模型的空气质量空间推断方法及系统


[0001]本专利技术涉及环境空气监测
,具体涉及一种基于双模型的空气质量空间推断方法及系统。

技术介绍

[0002]随着大数据、云计算、人工智能、物联网等技术的高速发展,固定/移动双网融合+智能数据模型/决策支持使大气环境高密度、高精度监测以及科学溯源和政策指引成为可能。
[0003]由于现有的空气质量监测方式通常采用移动+固定监测站,仅仅只能实现对城市局部空间的空气质量进行监测。

技术实现思路

[0004]针对现有技术中的上述不足,本专利技术提供了一种基于双模型的空气质量空间推断方法及系统。
[0005]为了达到上述专利技术目的,本专利技术采用的技术方案为:第一方面,本专利技术提出了一种基于双模型的空气质量空间推断方法,包括以下步骤:构建网格划分子模型,根据空气质量数据采集源触发的污染事件对全局空间进行网格分类;构建特征选择模型,根据全局空间内所有时空单元的多源特征和局部时空单元对应的已知空气质量数据选择最优空气质量特征;利用最优空气质量特征和对应的已知空气质量数据构成数据集训练空气质量空间推断模型;利用训练后的空气质量空间推断模型根据全局空间内所有时空单元的多源特征推断各个时空单元对应的空气质量数据。
[0006]进一步地,所述构建网格划分子模型,根据空气质量数据采集源触发的污染事件对全局空间进行网格分类,具体包括:对空气质量数据采集源触发的污染事件进行空气质量数据采集;对采集的污染事件的空气质量数据进行预处理;根据预处理结果将全局空间按照设定空间尺度在大气六种污染物维度划分为有污染网格和无污染网格。
[0007]进一步地,所述对采集的污染事件的空气质量数据进行预处理,具体包括:根据空气质量数据采集源的不同类型确定所触发的污染事件的污染物;根据可溯污染源与空气质量数据采集源的最大距离确定污染事件的污染半径;根据污染事件触发位置信息和污染半径确定每种污染物对应的有污染网格。
[0008]进一步地,所述构建特征选择模型,根据全局空间内所有时空单元的多源特征和
局部时空单元对应的已知空气质量数据选择最优空气质量特征,具体包括:获取任意时间戳和任意网格所代表的时空单元的多源特征,以及局部时空单元对应的已知空气质量数据;所述多源特征包括监测区域环境的静态空气质量特征和动态空气质量特征;对获取的多源特征和空气质量数据进行预处理;遍历每种污染物在局部时空单元对应的有污染网格和无污染网格下的设定数量的空气质量特征加入模型特征集合中;根据模型特征集合中的空气质量特征和对应的已知空气质量数据,建立相应的回归模型;分别计算各个回归模型的赤池值,从模型特征集合中剔除最小赤池值之外的空气质量特征;判断是否存在未遍历的空气质量特征;若是,则进行下一步骤;否则结束流程;将设定数量与模型特征集合中特征数量差值的空气质量特征加入模型特征集合中;根据模型特征集合中的空气质量特征和对应的空气质量数据,建立相应的回归模型;分别计算各个回归模型的赤池值;判断当前的最小赤池值是否小于前一轮的最小赤池值;若是,则从模型特征集合中剔除最小赤池值之外的新加入的空气质量特征;否则从模型特征集合中剔除所有新加入的空气质量特征;判断模型特征集合中特征数量是否不再增加或是否已遍历完所有空气质量特征;若是,则得到模型特征集合中选择的最优空气质量特征;否则继续遍历每种污染物在局部时空单元对应的有污染网格和无污染网格下的空气质量特征。
[0009]进一步地,所述对获取的多源特征和空气质量数据进行预处理,具体包括:对多源特征中的空值采用插值算法进行数据填补;对时间维度的缺失数据采用上一时间戳的数据进行数据填充;根据时间戳生成不同时间维度特征。
[0010]进一步地,所述利用最优空气质量特征和对应的已知空气质量数据构成数据集训练空气质量空间推断模型,具体包括:利用最优空气质量特征和对应的已知空气质量数据构成数据集;采用五折交叉方式将数据集划分为训练集和测试集;采用LightGBM模型构建空气质量空间推断模型,并设置模型参数为提升类型、树的最大深度、最大叶子数、学习速率、基学习器数量、目标、叶子节点中的最少数据、将特征值放入桶中的最大箱数;通过网格搜索方法生成模型参数的所有参数组合,并利用训练集和测试集分别训练空气质量空间推断模型;分别计算训练后的空气质量空间推断模型的五折交叉验证准确率,并选取最优的空气质量空间推断模型参数组合重新训练空气质量空间推断模型。
[0011]进一步地,所述利用训练后的空气质量空间推断模型根据全局空间内所有时空单
元的多源特征推断各个时空单元对应的空气质量数据,具体包括:利用训练后的空气质量空间推断模型,根据每种污染物在全局空间内所有时空单元对应的有污染网格和无污染网格下的空气质量特征推断对应的空气质量数据;将每种污染物在有污染网格和无污染网格下推断的空气质量数据结果进行合并,得到各个时空单元对应的空气质量数据。
[0012]第二方面,本专利技术提出了一种基于双模型的空气质量空间推断系统,包括:网格划分子模型模块,用于构建网格划分子模型,根据空气质量数据采集源触发的污染事件对全局空间进行网格分类;特征选择模型模块,用于构建特征选择模型,根据全局空间内所有时空单元的多源特征和局部时空单元对应的已知空气质量数据选择最优空气质量特征;推断模型训练模块,用于利用最优空气质量特征和对应的已知空气质量数据构成数据集训练空气质量空间推断模型;空气质量推断模块,用于利用训练后的空气质量空间推断模型根据全局空间内所有时空单元的多源特征推断各个时空单元对应的空气质量数据。
[0013]本专利技术具有以下有益效果:(1)本专利技术在固定/移动的双网监测背景下提出一个智能的城市高精度大气微环境感知方案,利用网格化城市多源大数据以及机器学习模型挖掘空气质量(污染物)排放、聚集、传输和消散的机理,并且准确可靠地推断城市局部空气质量情况。
[0014](2)本专利技术采用主子模型结合的形式,既采集了对城市空气质量数据高度相关的动静态数据,同时又吸纳了多种数据采集源触发的污染事件,并且对进入最终模型的多源特征进行特征选择,这种动静结合、常规和突发相结合的形式极大提高了模型的鲁棒性和准确性,并且推断网格高值和污染事件相对应,对污染溯源提供了坚实的模型基础。
附图说明
[0015]图1为本专利技术实施例1提供的一种基于双模型的空气质量空间推断方法流程示意图;图2为本专利技术实施例2提供的一种基于双模型的空气质量空间推断系统结构示意图。
具体实施方式
[0016]下面对本专利技术的具体实施方式进行描述,以便于本
的技术人员理解本专利技术,但应该清楚,本专利技术不限于具体实施方式的范围,对本
的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本专利技术的精神和范围内,这些变化是显而易见的,一切利用本专利技术构思的专利技术创造均在保护之列。
[0017]本专利技术通过数据采集源触发的污染事件给全域空间网格分类,把全域网格在大气六参(PM2.5, PM10, SO2, 本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于双模型的空气质量空间推断方法,其特征在于,包括以下步骤:构建网格划分子模型,根据空气质量数据采集源触发的污染事件对全局空间进行网格分类;构建特征选择模型,根据全局空间内所有时空单元的多源特征和局部时空单元对应的已知空气质量数据选择最优空气质量特征;利用最优空气质量特征和对应的已知空气质量数据构成数据集训练空气质量空间推断模型;利用训练后的空气质量空间推断模型根据全局空间内所有时空单元的多源特征推断各个时空单元对应的空气质量数据。2.根据权利要求1所述的基于双模型的空气质量空间推断方法,其特征在于,所述构建网格划分子模型,根据空气质量数据采集源触发的污染事件对全局空间进行网格分类,具体包括:对空气质量数据采集源触发的污染事件进行空气质量数据采集;对采集的污染事件的空气质量数据进行预处理;根据预处理结果将全局空间按照设定空间尺度在大气六种污染物维度划分为有污染网格和无污染网格。3.根据权利要求2所述的基于双模型的空气质量空间推断方法,其特征在于,所述对采集的污染事件的空气质量数据进行预处理,具体包括:根据空气质量数据采集源的不同类型确定所触发的污染事件的污染物;根据可溯污染源与空气质量数据采集源的最大距离确定污染事件的污染半径;根据污染事件触发位置信息和污染半径确定每种污染物对应的有污染网格。4.根据权利要求1所述的基于双模型的空气质量空间推断方法,其特征在于,所述构建特征选择模型,根据全局空间内所有时空单元的多源特征和局部时空单元对应的已知空气质量数据选择最优空气质量特征,具体包括:获取任意时间戳和任意网格所代表的时空单元的多源特征,以及局部时空单元对应的已知空气质量数据;所述多源特征包括监测区域环境的静态空气质量特征和动态空气质量特征;对获取的多源特征和空气质量数据进行预处理;遍历每种污染物在局部时空单元对应的有污染网格和无污染网格下的设定数量的空气质量特征加入模型特征集合中;根据模型特征集合中的空气质量特征和对应的已知空气质量数据,建立相应的回归模型;分别计算各个回归模型的赤池值,从模型特征集合中剔除最小赤池值之外的空气质量特征;判断是否存在未遍历的空气质量特征;若是,则进行下一步骤;否则结束流程;将设定数量与模型特征集合中特征数量差值的空气质量特征加入模型特征集合中;根据模型特征集合中的空气质量特征和对应的空气质量数据,建立相应的回归模型;分别计算各个回归模型的赤池值;判断当前的最小赤池值是否小于前一轮的最小赤池值;若是,则从模型特征集合中剔
除最小赤池值之外的新加入的空气质量特征;否...

【专利技术属性】
技术研发人员:韩科牟华侨
申请(专利权)人:四川国蓝中天环境科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1