一种基于多模型融合的臭氧预报方法技术

技术编号:37458411 阅读:14 留言:0更新日期:2023-05-06 09:30
本发明专利技术公开了一种基于多模型融合的臭氧预报方法,共分为以下几个步骤:数据预处理,特征工程,模型训练,模型评估,模型预测和模型修正。经过此过程最终得到可靠的臭氧预测结果,此种方式易于操作,数据获取容易,无需采集大量前体污染物排放数据,仅通过气象数据可对大部分臭氧污染情况进行预测,预测准确性大大提高,弥补了基于单个模型预测结果偏差大的不足。足。足。

【技术实现步骤摘要】
一种基于多模型融合的臭氧预报方法


[0001]本专利技术涉及环境空气质量预报
,特别是涉及一种基于多模型融合的臭氧预报方法。

技术介绍

[0002]臭氧可分为平流层臭氧和对流层臭氧,平流层臭氧天然存在于地球上层大气中,在距地球表面6

30英里形成保护层,保护我们免受太阳紫外线的伤害;对流层臭氧也称地面臭氧,它是大气层中氮氧化物与挥发性有机化合物经太阳照射发生光化学反应而产生。工业设施和电力设施、机动车尾气、汽油蒸汽和化学溶剂的排放是氮氧化物和挥发性有机化合物的主要来源。此外,生物源(活的有机体或生物过程)释放的VOC也会导致地面臭氧。
[0003]近年来,对流层臭氧浓度逐年升高,臭氧作为一种强氧化剂,对人类健康和环境有较大危害。但臭氧污染情况复杂,除高空和远距离传输外,其化学生成机制也很复杂,其与前体物(NOx和VOCs)转化关系呈非线性关系,因此很难提前制定有效的污染防控措施。
[0004]目前实时臭氧浓度污染计算模型主要包括:确定性模型(化学传输模型)和统计模型(机器学习等)方法。确定性模型通常通过三维网络欧拉化学模式(也叫区域性光化学烟雾模式)进行,它采用质量守恒大气扩散方程,以有限差分三维网格为架构,可以模拟气态与颗粒态污染物,模型所需的气象数据主要来自气象模型(如MM5、WRF等)模拟。统计模型主要利用大量污染监测历史数据及同期气象观测资料,分析臭氧污染浓度与气象及相关因子之间的统计关系,建立从简单到复杂的多参数模型。常见的臭氧预报方法有多元线性回归模型、支持向量机、决策树、随机森林和人工神经网络等。
[0005]当前臭氧预报很大程度上依赖于大量输入数据,其中包括气象数据和前体污染物排放清单等,实际数据获取较为困难、计算成本较高,计算结果不确定性较大,单一模型又很难得到准确的预测数据。
[0006]因此,需要提出一种能够相对准确预测臭氧浓度的方法。

技术实现思路

[0007]本专利技术的目的在于:为了解决上述提出的问题,提供一种基于多模型融合的臭氧预报方法。
[0008]本专利技术采用的技术方案如下:一种基于多模型融合的臭氧预报方法,主要包括以下步骤:
[0009]S1,数据预处理,收集本地区气象数据及臭氧浓度数据,并对数据进行必要的预处理操作;
[0010]S2,特征工程,进行本地区臭氧浓度与气象数据及时间维度的相关性分析,根据各气象因子与臭氧浓度相关系数排名,确定参与算法建模的特征项;
[0011]S3,模型训练,根据筛选出的特征项分别采用SVM、KNN、RF、LSTM四种算法模型对历史数据进行模型训练;
[0012]S4:模型评估,通过训练好的模型对验证集数据进行预测,采用模型评估算法对四种模型预测结果进行评估;
[0013]S5:模型预测,选取模型评估结果排名前三的模型,分别采用三种模型对待预测数据进行模型预测;
[0014]S6:模型修正,采用模型评估结果排名前三的模型对验证集的模型预测结果与验证集实测臭氧浓度建立多元线性关系,求解系数并对待预测数据的预测结果进行修正。
[0015]进一步地,步骤S3模型训练过程中选取的特征变量包括温度、湿度、湿球温度、风速、压力变化、小时、月份,目标变量为臭氧浓度。
[0016]进一步地,步骤S1数据预处理具体包括数据整合,缺失值填充,异常值处理。
[0017]进一步地,步骤S2特征工程主要包括温度、湿度、湿球温度、风速、压力变化与臭氧浓度的相关性以及臭氧浓度随季节变化趋势及臭氧日变化趋势,以及连续特征(温度、湿度、湿球温度、风速、压力变化)的标准化和对离散特征(小时、月份)进行编码。
[0018]进一步地,步骤S4模型评估指标k的计算方式为:
[0019][0020]其中y
real
表示真实观测值,y
pred
表示预测值,n表示参与评估的验证集的数据个数。其中k的计算结果越接近于1表示模型的预测效果越好。
[0021]进一步地,步骤S6模型修正过程如下:
[0022]y
corrected
=a*y1+b*y2+c*y3+d
[0023]其中,a,b,c,d由验证集模型预测结果与验证集实测臭氧浓度建立多元线性关系求取,y1,y2,y3分别为排名前三的模型针对当前时刻的预测结果。
[0024]进一步地,缺失值填充具体指对于缺失值采用前一行同列数据进行代替,当连续缺失值超过3条时,分别采用近一周同时刻特征平均值进行代替;异常值处理具体指对于特征向量进行聚类,选取聚类中心,给定距离范围,以聚类中心为起点,依次计算距离范围内的包含点数,当点数小于某一阈值时判定当前点为异常点进行剔除,不予参加模型的训练。
[0025]进一步地,任意两个特征之间的相关性可通过如下表达式进行计算:
[0026][0027]其中(x1,x2,...,x
n
),(y1,y2,...,y
n
)为待计算的2个n维向量。
[0028]进一步地,经过标准化的特征数据符合标准正态分布,即均值为0,标准差为1,使得模型更容易达到收敛状态,其标准化转换过程如下:
[0029][0030]其中x为需要转换的变量,x
*
为转换后的变量,n为向量维数。
[0031]进一步地,由于月份、小时这种离散特征直接当作连续变量参与模型的训练,会直接影响模型的性能,直接对月份、小时这两个特征进行独热编码又会导致特征变量过多,矩阵过于稀疏,加大模型的训练时间,因此,当前离散特征值可以通过除此之外的相同特征值的目标变量的平均值进行代替,这样既能减小特征值对于目标变量的依赖性,又可以增加特征值的多样性,创建更多样性的编码值,使得异常值的影响趋于平稳。
[0032]综上所述,由于采用了上述技术方案,本专利技术的有益效果是:
[0033]易于操作,数据获取容易,无需采集大量前体污染物排放数据,仅通过气象数据可对大部分臭氧污染情况进行预测,预测准确性大大提高,弥补了基于单个模型预测结果偏差大的不足。
附图说明
[0034]图1为一种基于多模型融合的臭氧预报方法的整体流程图;
[0035]图2为实施例1中无锡市气象数据(温度)与臭氧浓度的散点图;
[0036]图3为实施例1中无锡市气象数据(湿度)与臭氧浓度的散点图;
[0037]图4为实施例1中无锡市气象数据(湿球温度)与臭氧浓度的散点图;
[0038]图5为实施例1中无锡市气象数据(气压变化)与臭氧浓度的散点图;
[0039]图6为实施例1中无锡市在时间维度(月份)上臭氧浓度的趋势分布图;
[0040]图7为实施例1中无锡市在时间维度(小时)上臭氧浓度的趋势分布图;
[0041]图8为实施例1中三种算法模型的臭氧浓度预测结果与实测臭氧浓度的对比图;
[0042]图9为实施例1中经过校正模型后的臭氧本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多模型融合的臭氧预报方法,其特征在于,主要包括以下步骤:S1,数据预处理,收集本地区气象数据及臭氧浓度数据,并对数据进行必要的预处理操作;S2,特征工程,进行本地区臭氧浓度与气象数据及时间维度的相关性分析,根据各气象因子与臭氧浓度相关系数排名,确定参与算法建模的特征项;S3,模型训练,根据筛选出的特征项分别采用SVM、KNN、RF、LSTM四种算法模型对历史数据进行模型训练;S4:模型评估,通过训练好的模型对验证集数据进行预测,采用模型评估算法对四种模型预测结果进行评估;S5:模型预测,选取模型评估结果排名前三的模型,分别采用三种模型对待预测数据进行模型预测;S6:模型修正,采用模型评估结果排名前三的模型对验证集的模型预测结果与验证集实测臭氧浓度建立多元线性关系,求解系数并对待预测数据的预测结果进行修正。2.根据权利要求1所述的基于多模型融合的臭氧预报方法,其特征在于,步骤S3模型训练过程中选取的特征变量包括温度、湿度、湿球温度、风速、压力变化、小时、月份,目标变量为臭氧浓度。3.根据权利要求1所述的基于多模型融合的臭氧预报方法,其特征在于,步骤S1数据预处理具体包括数据整合,缺失值填充,异常值处理。4.根据权利要求1所述的基于多模型融合的臭氧预报方法,其特征在于,步骤S2特征工程主要包括温度、湿度、湿球温度、风速、压力变化与臭氧浓度的相关性以及臭氧浓度随季节变化趋势及臭氧日变化趋势,以及连续特征(温度、湿度、湿球温度、风速、压力变化)的标准化和对离散特征(小时、月份)进行编码。5.根据权利要求1所述的基于多模型融合的抽样预报方法,其特征在于,步骤S4模型评估指标k的计算方式为:其中y
real
表示真实观测值,y
pred
表示预测值,n表示参与评估的验证集的数据个数。其中k的计算结果越接近于1表示模型的预测效果越好。6.根据权利要求1所述的基于...

【专利技术属性】
技术研发人员:万学平王昭娜于潇萌高洁张继荣
申请(专利权)人:无锡中科光电技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1