一种基于空间分组建模的BP神经网络空气质量预报方法技术

技术编号:36454366 阅读:16 留言:0更新日期:2023-01-25 22:52
本申请公开了一种基于空间分组建模的BP神经网络空气质量预报方法,涉及空气质量预报技术领域,包含模型训练阶段和自动预报阶段。本发明专利技术采用高时频高精度实测数据作为模型训练的样本数据,并对重污染天气样本进行重采样;同时结合相关性矩阵进行空间分组建模的方法,根据风向动态筛选每个站点预报所选用的空间模型组;然后再利用统计指标及本发明专利技术特有的分类统计指标筛选出该空间模型组中最优的模型来模拟生成预报结果。从而提升预报数据的准确率,同时采用该方法输出的预报数据还能够精确到区县监测站点。确到区县监测站点。确到区县监测站点。

【技术实现步骤摘要】
一种基于空间分组建模的BP神经网络空气质量预报方法


[0001]本专利技术涉及空气质量预报
,具体涉及一种基于空间分组建模的BP神经网络空气质量预报方法。

技术介绍

[0002]空气质量与人类健康之间的关系已经引起了广泛关注,已有不少学者对此做了大量研究。空气质量预报在污染事件发生前对公众的预警及制定减灾计划方面尤为重要,国内外学者也利用数值机理模型及统计模型来对空气质量进行预报,试图精准预测污染事件的发生,为减灾计划提供支持。
[0003]目前国内外常用的一种基于空间分组建模的BP神经网络空气质量预报方法有:潜势预报法、数值机理预报法及统计预报法。统计预报法是收集过去较长时间的气象数据与监测的污染物浓度数据,通过统计的方法如:多元线性回归、神经网络或机器学习等方法来建立气象条件与污染物浓度数据之间的相关关系,并在后续预报过程中,根据预报的气象条件来计算或预测污染物浓度数据。
[0004]潜势预报法即为预报员根据天气形势来进行主观研判,具有较大的不确定性,很少独立使用;数值机理预报法是基于污染源排放清单及气象预报数据,模拟预测排放源所排放的污染物在环境空气中发生一系列物理化学反应后在空气中的浓度,而对于PM2.5及O3这类二次污染物,数值机理模拟预测是一项十分复杂的系统过程,目前的数值机理预报法并不能完全描述其生成的机理过程;且数值机理预报法的预报准确率大大依赖于污染源排放清单的准确度,就目前而言,收集准确的污染源排放清单还具有一定的难度,虽然目前多数城市都开展了使用数值机理预报法来做空气质量预报的工作,但结果并不理想,仍需要人工研判来提高预报准确率;由于数值机理预报法的缺陷,目前越来越多的环保单位开始采用统计预报方法来进行空气质量预报工作。BP神经网络算法是常用的统计预报方法之一,其预报准确率要普遍高于数值机理预报法,在一些城市取得了较好的应用效果。但是由于其对污染极值不够敏感,使其在重污染发生时段的预报准确率较低。
[0005]以上三种预报方法都存在一定的局限性,预报效果不甚理想。基于BP神经网络算法的统计预报法虽然对一般污染天气有较高的预报准确率,但对重污染事件的预报准确率仍然较低。因而需要不断优化现有算法,才能提高预报准确率,这也是环保业务部门所急需的。
[0006]基于此,我们提出一种基于空间分组建模的BP神经网络空气质量预报方法。

技术实现思路

[0007]本专利技术的目的在于克服现有技术中存在的上述问题,提供一种基于空间分组建模的BP神经网络空气质量预报方法,便于提升预报数据的准确率,同时采用该方法输出的预报数据还能够精确到区县监测站点。
[0008]为实现上述技术目的,达到上述技术效果,本专利技术是通过以下技术方案实现:
[0009]一种基于空间分组建模的BP神经网络空气质量预报方法,包含模型训练阶段和自动预报阶段,具体包括以下步骤:
[0010]S1:模型训练阶段
[0011]S101:数据采集:收集目标预报区域的国控监测站点及区县监测站点近三年的小时分辨率的污染物浓度数据;
[0012]S102:数据清洗:对采集到的数据进行多种方式的自动清洗,清洗后的数据还要进行是否符合正态分布的检验;
[0013]S103:对重污染天气样本进行重采样,重采样后的数据备用;
[0014]S104:气象数据预处理:将下载的气象预报数据转换为需要的格式,并将各气象因子数据进行标准化处理;
[0015]S105:分析目标预报区域各站点之间与区县站点之间的空间依赖关系,即分析分析各国控监测站点污染物浓度与周边区县站点污染物浓度之间的相关关系;
[0016]S106:根据目标预报区域各站点与周边区县站点之间的空间依赖关系,进行空间分组建模;
[0017]S107:分析污染物浓度数据与气象因子数据之间的相关性,分析目标预报区域各国控监测站点污染物浓度数据与各气象因子数据之间的相关性,筛选气象参数集;
[0018]S108:配置和构建多个空气质量预报模型,所配置的模型包含:输入层、4个隐含层以及输出层;
[0019]S109:训练模型:对构建的多个空气质量预报模型进行训练,训练分两种模式,一种是常规模式;另一种是污染超标模式;训练模型的数据占总样本数量的70%,剩余30%的样本数量用于模型验证;
[0020]S110:模型验证:包含两种一般统计指标:均方根误差和判定系数;和三种分类统计指标:超标天数预测正确比例、成功指数和错误预警比例;
[0021]S111:通过步骤S110叙述的一般统计指标和分类统计指标来针对不同的污染物在不同的站点以及不同的预报时段,自动选择最优的模型作为自动预报阶段使用的模型;
[0022]S2:自动预报阶段
[0023]S201:监测数据采集:编写针对目标预报区域的国控监测站点及区县监测站点的数据采集程序,连续实时采集小时分辨率的污染物浓度数据,作为自动预报阶段的输入数据;
[0024]S202:气象数据采集:编写了自动下载GFS气象预报数据的程序,可以将气象数据格式转换为自动预报阶段所需要的格式并进行气象因子数据的标准化处理;
[0025]S203:判断风向:利用风向判断程序自动判断预报天的风向;
[0026]S204:根据风向动态筛选每个站点预报所选用的空间模型组;
[0027]S205:自动判断最终预报结果,当常规模式预报值达到一定数值后,就会使用污染超标模式下的预报结果为最终预报结果,反之则会使用常规模式下的预报结果为最终预报结果。
[0028]优选地,重采样的方法如下:
[0029]X'=X
min
+randΟ
×
(X
max

X
min
)
[0030]X
max
—为样本中的最大值;
[0031]X
min
—为样本中的最小值;
[0032]randΟ—为0

1之间的均匀分布随机实数;
[0033]X'—为重采样后的数据。
[0034]优选地,标准化处理的方法为:Y=log
(1+y)

[0035]y—为实际气象因子数据;
[0036]Y—为标准化处理后的气象因子数据。
[0037]优选地,输入层中包含空间因子、气象因子以及时间因子;隐含层选择4层;输出层为污染物预报浓度。
[0038]优选地,常规模式为直接采用步骤S102中数据清洗之后的常规污染物浓度数据以及气象因子数据等对模型进行训练。
[0039]优选地,污染超标模式为采用步骤S103中对重污染天气样本进行重采样后的样本数据以及气象因子数据对模型进行训练。
[0040]优选地,均方根误差的计算公式为:判定系数的计算公式为:
[0041][0042]上述式中,X
OBS,i
—代表第i天的监本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于空间分组建模的BP神经网络空气质量预报方法,其特征在于:包含模型训练阶段和自动预报阶段,具体包括以下步骤:S1:模型训练阶段S101:数据采集:收集目标预报区域的国控监测站点及区县监测站点近三年的小时分辨率的污染物浓度数据;S102:数据清洗:对采集到的数据进行多种方式的自动清洗,清洗后的数据还要进行是否符合正态分布的检验;S103:对重污染天气样本进行重采样,重采样后的数据备用;S104:气象数据预处理:将下载的气象预报数据转换为需要的格式,并将各气象因子数据进行标准化处理;S105:分析目标预报区域各站点之间与区县站点之间的空间依赖关系,即分析分析各国控监测站点污染物浓度与周边区县站点污染物浓度之间的相关关系;S106:根据目标预报区域各站点与周边区县站点之间的空间依赖关系,进行空间分组建模;S107:分析污染物浓度数据与气象因子数据之间的相关性,分析目标预报区域各国控监测站点污染物浓度数据与各气象因子数据之间的相关性,筛选气象参数集;S108:配置和构建多个空气质量预报模型,所配置的模型包含:输入层、4个隐含层以及输出层;S109:训练模型:对构建的多个空气质量预报模型进行训练,训练分两种模式,一种是常规模式;另一种是污染超标模式;训练模型的数据占总样本数量的70%,剩余30%的样本数量用于模型验证;S110:模型验证:包含两种一般统计指标:均方根误差和判定系数;和三种分类统计指标:超标天数预测正确比例、成功指数和错误预警比例;S111:通过步骤S110叙述的一般统计指标和分类统计指标来针对不同的污染物在不同的站点以及不同的预报时段,自动选择最优的模型作为自动预报阶段使用的模型;S2:自动预报阶段S201:监测数据采集:编写针对目标预报区域的国控监测站点及区县监测站点的数据采集程序,连续实时采集小时分辨率的污染物浓度数据,作为自动预报阶段的输入数据;S202:气象数据采集:编写了自动下载GFS气象预报数据的程序,可以将气象数据格式转换为自动预报阶段所需要的格式并进行气象因子数据的标准化处理;S203:判断风向:利用风向判断程序自动判断预报天的风向;S204:根据风向动态筛选每个站点预报所选用的空间模型组;S205:自动判断最终预报结果,当常规模式预报值达到一定数值后,就会使用污染超标模式下的预报结果为最终预报结果,反之...

【专利技术属性】
技术研发人员:朱媛媛王淑莹刘冰尹翠芳李翔宇穆宏蕾
申请(专利权)人:中国环境监测总站
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1