一种基于数据挖掘的二次空气质量预报优化方法技术

技术编号:32790112 阅读:19 留言:0更新日期:2022-03-23 19:51
本发明专利技术公开了一种基于数据挖掘的二次空气质量预报优化方法,包括以下步骤:S1、对监测点的实测数据中的异常值进行追踪,对追踪到的异常值进行数据修正;S2、根据修正后的实测数据获取监测点的AQI值,根据AQI值进行空气质量等级分类,并获取实测数据中不同天气条件维度对AQI值的影响程度;S3、利用已知的一次预报数据,通过LSTM网络和随机森林建立各污染物浓度的二次预报模型;S4、引入当前监测点的其他相邻监测点的实测数据,对当前监测点的二次预报模型进行优化。本发明专利技术提高了气象数据的预报精度。度。度。

【技术实现步骤摘要】
一种基于数据挖掘的二次空气质量预报优化方法


[0001]本专利技术涉及气象预测领域,具体涉及一种基于数据挖掘的二次空气质量预报优化方法。

技术介绍

[0002]大气污染问题已经引起了全国甚至全球的广泛关注。建立空气质量预报模型对提前获取可能发生的大气污染并采取相应的防控措施显得尤为重要。国家环境预报中心(NCEP)做的数值天气预报就指导着国家天气局(NWS)发布的天气预报。目前,空气质量预报方法基本分为统计预报和数值预报,即根据过去一段时间的空气污染物的排放情况、气象条件、大气扩散情况、地理地貌等因素来预测第二天或者未来几天的空气污染程度,及时发布预警,并提前采取相应的措施。数值预报在国内比较盛行,而国外由最开始的EKMA逐渐发展到现在的第三代模式,这种模式的研究核心是空气质量模式CMAQ。
[0003]目前最常用的空气质量预测模型是WRF

CMAQ模型。该模型主要分为 WRF和CMAQ两个部分,WRF是一种中尺度数值天气预报系统,多用于大气研究和业务预测,能够为CMAQ提供所需的气象场数据;CMAQ是一种三维欧拉大气化学与传输模拟系统,它能够将WRF的气象信息及场域内的污染排放清单,基于化学与物理等原理模拟污染物的变化过程,预测空气中的气体和粒子的浓度,从而得到具体时间点或时间段的预报结果。
[0004]由于模拟的气象场以及排放清单的不确定性,以及对包括臭氧在内的污染物生成机理的不完全明晰性,所以WRF

CMAQ预报模型的结果并不理想。

技术实现思路
<br/>[0005]本专利技术的目的在于提供一种基于数据挖掘的二次空气质量预报优化方法,以提高气象预测的准确率。
[0006]为解决上述技术问题,本专利技术提供了一种技术方案:一种基于数据挖掘的二次空气质量预报优化方法,包括以下步骤:
[0007]S1、对监测点的实测数据中的异常值进行追踪,对追踪到的异常值进行数据修正;
[0008]S2、根据修正后的实测数据获取监测点的AQI值,根据AQI值进行空气质量等级分类,并获取实测数据中不同天气条件维度对AQI值的影响程度;
[0009]S3、利用已知的一次预报数据,通过LSTM网络和随机森林建立各污染物浓度的二次预报模型;
[0010]S4、引入当前监测点的其他相邻监测点的实测数据,对当前监测点的二次预报模型进行优化。
[0011]按上述方案,S1中对实测数据的异常值追踪具体为,利用七点二阶算式进行异常判别,其中原始数据序列为{y
k
},七点二阶算式输出的数据序列为,七点二阶算式计算公式为:
[0012][0013]随后计算差值并进行异常值判断,当差值满足下列公式时,即判断为异常值:
[0014][0015]按上述方案,S1中数据修正具体为:
[0016]假设{y
k
}中y
k
,y
k+1
,

y
k+m
是异常值,则将y
k
‑3,y
k
‑2,y
k
‑1,y
k+m+1
,y
k+m+2
,y
k+m+3
作为输入,采用拉格朗日插值法对异常值进行修正:
[0017][0018]其中t代表时间,t
l

t
i
与t
j

t
i
表示不同的时间间隔。
[0019]按上述方案,S2中AQI值通过AQI公式进行计算,以获取监测点的首要污染物,AQI公式如下:
[0020][0021]其中,IAQI
P
为污染物P的空气质量分指数,结果进位取整数;C
P
为污染物 P的质量浓度值;BP
Hi
、BP
Lo
为与C
P
相近的污染物浓度限值的高位值与低位值; IAQI
Hi
、IAQI
Lo
为与BP
Hi
、BP
Lo
对应的空气质量分指数。
[0022]按上述方案,S2中空气质量等级分类分为优、良、轻度污染、中度污染、严重污染;天气条件维度包括风向、风速、温度、湿度、气压;随后采用K
‑ꢀ
means算法对上述维度进行计算:
[0023]A=(a1,a2,...,a
n
),B=(b1,b2,...,b
n
)
[0024][0025]其中,A为给定的样本集,B为质心向量,dis(A,B)为样本集A中的点到各质心向量的距离;通过K

means算法得到风向、风速、温度、湿度、气压的中心值,随后通过随机森林算法得到不同天气条件维度对AQI值的影响程度。
[0026]按上述方案,S3中二次预报模型建立过程具体为:
[0027]对监测点的一次预报数据进行处理:
[0028][0029]其中,代表t时刻的一次预报数据处理后的预测结果,f
i
表示第i天对t 时刻的一次预报预测值,w
i
代表f
i
对t时刻一次预报的贡献值;
[0030]随后,选定t时刻的前7个小时污染物浓度实测数据构建出加权平均变量于是有:
[0031][0032]其中i=(1,2,

,6),K表示当前的监测点;表示预测第i个污染物的二次预测模型的预报值,表示一次预报的第i个污染物的数据,表示当前预测第i种污染物前7小时t

7到t

1时刻做加权平均的结果,其权重为[0.4,0.2,0.1,0.1,0.08,0.06,0.06];
[0033]随后用LSTM网络和随机森林对θ
i
,i=1,2,...,7的权重值进行训练。
[0034]按上述方案,LSTM网络包括输入层、隐藏层和输出层,LSTM网络在二次预测模型的训练中通过反向传播机理对隐藏层中的权重进行迭代训练,其迭代过程为:
[0035][0036]LSTM网络表达式为:
[0037]z
t
=σ(W
z
·
[h
t
‑1,x
t
])
[0038]r
t
=σ(W
r
·
[h
t
‑1,x
t
])
[0039][0040][0041]其中,z
t
表示更新门,r
t
为重置门,h
t
为当前更新状态信息;W
x
、W
h
、W
y
分别表示输出层、隐藏层和输出层的权值;b
h
、b
y
分别表示隐藏层本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据挖掘的二次空气质量预报优化方法,其特征在于:包括以下步骤:S1、对监测点的实测数据中的异常值进行追踪,对追踪到的异常值进行数据修正;S2、根据修正后的实测数据获取监测点的AQI值,根据AQI值进行空气质量等级分类,并获取实测数据中不同天气条件维度对AQI值的影响程度;S3、利用已知的一次预报数据,通过LSTM网络和随机森林建立各污染物浓度的二次预报模型;S4、引入当前监测点的其他相邻监测点的实测数据,对当前监测点的二次预报模型进行优化。2.根据权利要求1所述的基于数据挖掘的二次空气质量预报优化方法,其特征在于:S1中对实测数据的异常值追踪具体为,利用七点二阶算式进行异常判别,其中原始数据序列为{y
k
},七点二阶算式输出的数据序列为,七点二阶算式计算公式为:随后计算差值并进行异常值判断,当差值满足下列公式时,即判断为异常值:3.根据权利要求2所述的基于数据挖掘的二次空气质量预报优化方法,其特征在于:S1中数据修正具体为:假设{y
k
}中y
k
,y
k+1
,

y
k+m
是异常值,则将y
k
‑3,y
k
‑2,y
k
‑1,y
k+m+1
,y
k+m+2
,y
k+m+3
作为输入,采用拉格朗日插值法对异常值进行修正:其中t代表时间,t
l

t
i
与t
j

t
i
表示不同的时间间隔。4.根据权利要求1所述的基于数据挖掘的二次空气质量预报优化方法,其特征在于:S2中AQI值通过AQI公式进行计算,以获取监测点的首要污染物,AQI公式如下:
其中,IAQI
P
为污染物P的空气质量分指数,结果进位取整数;C
P
为污染物P的质量浓度值;BP
Hi
、BP
Lo
为与C
P
相近的污染物浓度限值的高位值与低位值;IAQI
Hi
、IAQI
Lo
为与BP
Hi
、BP
Lo
对应的空气质量分指数。5.根据权利要求1所述的基于数据挖掘的二次空气质量预报优化方法,其特征在于:S2中空气质量等级分类分为优、良、轻度污染、中度污染、严重污染;天气条件维度包括风向、风速、温度、湿度、气压;随后采用K

means算法对上述维度进行计算:A=(a1,a2,...,a
n
),B=(b1,b2,...,b
n
)其中,A为给定的样本集,B为质心向量,dis(A,B)为样本集A中的点到各质心向量的距离;通过K

means算法得到风向、风速、温度、湿度、气压的中心值,随后通过随机森林算法得到不同天气条件维度对AQI值的影响程度。6.根据权利要求1所述的基于数据挖掘的二次空气质量预报优化方法,其特征在于:S3中二次预报模型建立过程具体为:对监测点的一次预报数据进行处理:其中,代表t时刻的一次预报数据处理后的预测结果,f
i
表示第i天对t时刻的一次预报预测值,w
i
代表f
i
对t时刻一次预报的贡献值;随后,选定t时刻的前7个小时污染物浓度实测数据构建出加权平均变量于是有:其中i=(1,2,

,6),K表示当前的监测点;表示预测第i个污染物的二次预测模型的预报值,表示一次预报的第i个污染物的数据,表示当前预测第i种污染物前7小时...

【专利技术属性】
技术研发人员:李芳徐俊武
申请(专利权)人:武汉工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1