【技术实现步骤摘要】
基于LSTM神经网络的空气质量二次预报模型构建方法
[0001]本专利技术涉及环境监测领域,具体涉及基于LSTM神经网络的空气质量二次预 报模型构建方法。
技术介绍
[0002]大气污染系指由于人类活动或自然过程引起某些物质进入大气中,呈现足够 的浓度,达到了足够的时间,并因此危害了人体的舒适、健康和福利或危害了生 态环境。污染防治实践表明,建立合适的空气质量预报模型,提前获知可能发生 的大气污染过程并采取相应控制措施,是减少大气污染对人体健康和环境等造成 的危害,提高环境空气质量的有效方法之一。
[0003]当前对空气质量进行预报最常用的模拟系统为WRF
‑
CMAQ模拟系统;但由 于模拟气象场和排放清单的不确定性,以及对包括臭氧在内的污染物生成机理的 不完全明晰,导致用WRF
‑
CMAQ模型精确预测污染物浓度变化难度很高;所以 需要在WRF
‑
CMAQ等一次预报模型模拟结果的基础上,结合更多的数据源进行 再建模,得到更好的预测效果,以提高预报的准确性。
...
【技术保护点】
【技术特征摘要】
1.基于LSTM神经网络的空气质量二次预报模型构建方法,其特征在于:是基于相关监测点长期空气质量预报基础数据,来进行空气质量预报二次预报模型的构建的;其中,相关监测点长期空气质量预报基础数据包括污染物浓度一次预报数据、气象一次预报数据、气象实测数据和污染物浓度实测数据;构建方法分为三阶段,具体包括如下述阶段:第一阶段:对相关监测点长期空气质量预报基础数据进行预处理,以保证后续模型的质量;并对各污染物和气象条件进行相关性分析,得到Pearson相关系数,根据不同气象条件对污染物浓度的影响程度进行分类;第二阶段:建立基于LSTM神经网络二次预报模型;在一次预报模型模拟结果的基础上结合第一阶段中的基础数据进行再建模;通过相关系数,选取对应的气象特征,作为LSTM神经网络的输入集,结合实测测试数据,预测几个监测点在同日的污染物浓度并计算空气质量指数AQI;通过相对误差检验,决定系数R2检验以及鲁棒性检验对模型进行评价分析;第三阶段:对二次预报模型进行改进,增加三倍相同维度的数组输入,网络输入协同地区监测点的数据作为训练集和测试集,输出预测的其中一个监测点的六项污染物浓度的预测值,分析研究协同预报模型能否提升针对监测点A的污染物浓度预报准确度。2.根据权利要求1所述的基于LSTM神经网络的空气质量二次预报模型构建方法,其特征在于:对收集到的相关监测点长期空气质量预报基础数据进行预先的处理:根据拉依达准则即3σ准则剔除异常值;对被测量变量进行精度测量,得到x1,x2,
…
x
n
,算出其算术平均值x及剩余误差v
i
=x
i
‑
x(i=1,2,
…
,n),根据贝塞尔公式算出标准误差σ,若某个测量值x
i
的剩余误差v
i
(1≤i≤n),满足|v
i
|=|x
i
‑
x|>3σ,则认为x
i
是含有粗大误差值的坏值,应予剔除;贝塞尔公式如下:对数据缺失值进行插补;考虑到大气污染数据及气象数据具有较强的时序性,属于非离散的数值,不会随时间出现大幅度的变高或变低,变化趋势较缓,即不会随时间出现大幅度的变高或变低,因此,采取均值法对缺失数据进行插值处理,即通过缺失值前后的时间范围内的均值数据进行插值补全;不同评价指标往往具有不同的量纲和量纲单位,若直接对数据进行分析会影响有关数据分析的结果,为了消除数据之间的量纲影响,需要进行数据归一化处理;运用min
‑
max标准化方法对数量级进行归一化处理,公式可表成:其中,x
*
是归一化后的数据,数值区间为[0,1]。x
min
,x
max
分别为样本数据最小值和最大值。3.根据权利要求1所述的基于LSTM神经网络的空气质量二次预报模型构建方法,其特征在于:所述第一阶段中的相关性分析是通过对不同特征或者数据之间的关系进行分析,进而研究分析多个变量因素的相关密切程度的一种多元统计方法,其可以揭示不同变量之间的内在关联;
在污染物排放情况不变的条件下,某一地区的气象条件有利于污染物扩散或沉降时,该地区的AQI会下降,反之则会上升;对各污染物和天气条件进行相关性分析,在对气象条件进行分类,研究其对各污染物浓度的影响程度相关工作至关重要;15个气象条件为X
i
(i=1,
…
,15),各污染物小时平均浓度为Y
j
(j=1,
…
,6);计算变量X,Y的之间Pearson相关系数;计算公式如下:对于样本Pearson相关系数有:4.根据权利要求1所述的基于LSTM神经网络的空气质量二次预报模型构建方法,其特征在于:所述LSTM是长短期记忆神经网络,是一种非常适用于时间序列建模的网络结构;大气污染数据及气象数据具有较强的时序性,不会随时间出现大幅度的变高或变低,变化趋势较缓;LSTM它的整体结构是一个LSTM单元模块,这个模块内的参数是每个时间状态共享的,即它的每一个LSTM单元的输出会重新作为输入重复进入LSTM单元,另一方面LSTM单元内部还有一个长期记忆单元,控制每一个时间状态应该记忆或遗忘掉的信息是否传入下一个时间状态;每个时间状态下也会传入LSTM单元一个新的输入信息;LSTM也是通过反向传播算法进行误差更新,每个时间状态产生的结果会持续累积直到LSTM序列的结束,而误差也会随着时间反向累积更新LSTM单元内部各个参数;最...
【专利技术属性】
技术研发人员:金晶亮,邱雅茹,张霰月,温晴岚,程思齐,郭晓君,
申请(专利权)人:南通大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。