一种基于XGBoost的臭氧质量预测方法及系统技术方案

技术编号:36186291 阅读:53 留言:0更新日期:2022-12-31 20:51
本发明专利技术提出一种基于XGBoost的大气臭氧浓度的预测方法及系统。该方法包括:大气基站数据数据获取及预处理、数据归一化、搭建模型及训练和模型推理等步骤。本方法将气象数据和空气质量数据相结合,其中气象数据主要用到温度、湿度、风速、气压四种数据,空气质量数据有O3、PM2.5、PM10、SO2、NO2、CO六种数据。充分考虑多种因素对臭氧浓度的影响,方法简易操作,具有较高的预测精度。该方法利用预测当日前五天的数据预测未来三天的臭氧浓度,为环保部门开展臭氧污染趋势预报提供依据。展臭氧污染趋势预报提供依据。展臭氧污染趋势预报提供依据。

【技术实现步骤摘要】
一种基于XGBoost的臭氧质量预测方法及系统


[0001]本专利技术涉及环境保护
以及气象预测
,并特别涉及一种基于XGBoost的臭氧质量预测方法及系统。

技术介绍

[0002]近年来,空气污染问题已成为社会热点问题,在空气污染治理方面,实时掌握空气的污染情况,并且对空气质量进行中长期趋势预测,能够为空气污染治理工作提供可靠的依据。常见的大气污染物浓度预测方法主要有两类:基于数值模式的预测方法和基于统计模型的预测方法。数值模式的预测方法是以大气动力学理论为基础,在给定的气象条件、污染源排放清单以及初始边界条件下,通过一套复杂的偏微分方程组模拟大气污染物在实际大气中的各种物理化学过程,预报污染物浓度动态分布和变化趋势。基于统计模式的预测方法以空气质量监测数据、气象监测数据等多种类型数据为基础,利用统计方法,建立预测模型,实现大气污染物浓度预测。传统的统计模型预测仅考虑单一大气污染物浓度变化,利用ARIMA、Holt

Winters等时间序列预测模型进行浓度预测,预测精度较低且预测时效较短。后有方法提出利用大气污染物浓度和温度、湿度等气象因素进行多元线性回归,预测精度相比ARIMA等时间序列预测模型要准。近年来,随着机器学习算法的不断发展,支持向量机、人工神经网络等机器学习算法被不断引入大气污染物浓度预测任务中来,这些方法对多源数据进行综合考虑,预测效果有所提升。但是,目前国内常见的基于统计模型的大气污染物浓度预测方法一般只对空气质量的日数据进行分析,未考虑小时级别的精确预测;仅对某一市的整体空气质量进行分析,未考虑记录数据的监测站点位置以及周围环境。

技术实现思路

[0003]本专利技术的目的是解决现有的空气质量预测方法难以建立精准的预测模型问题,而提供了一种基于回归预测模型XGBoost的空气质量预测方法。
[0004]针对现有技术的不足,本专利技术提出一种基于回归预测模型的大气臭氧浓度的预测方法,其中包括:
[0005]步骤1、获取同一地区的历史气象数据和历史空气质量数据,其中该历史空气质量数据包括大气臭氧浓度;并将相同时间的该空气质量数据和该气象数据进行匹配,得到匹配数据;
[0006]步骤2、根据起报时刻t前h时刻到起报时刻t内的气象和空气质量数据,预测t后x时刻的大气臭氧浓度为划分目标,将匹配数据划分为监督回归预测数据,以该监督回归预测数据训练回归预测模型,得到大气臭氧浓度预测模型;
[0007]步骤3、将待预测时刻前h时刻到该待预测时刻内的气象和空气质量数据输入该大气臭氧浓度预测模型,得到该待预测时刻后x时刻的大气臭氧浓度作为大气臭氧浓度的预测结果。
[0008]所述的一种基于回归预测模型的大气臭氧浓度的预测方法,其中该回归预测模型
为XGBoost模型;
[0009]所述的一种基于回归预测模型的大气臭氧浓度的预测方法,其中该气象数据为温度、湿度、风速和气压数据,该空气质量数据为O3、PM2.5、PM10、SO2、NO2和CO浓度数据。
[0010]所述的一种基于回归预测模型的大气臭氧浓度的预测方法,其中该步骤1包括对历史气象数据和历史空气质量数据进行预处理,预处理内容包括:对历史气象数据和历史空气质量数据中的缺失值和错误值进行补齐处理。
[0011]本专利技术还提出了一种基于回归预测模型的大气臭氧浓度的预测系统,其中包括:
[0012]初始模块,用于获取同一地区的历史气象数据和历史空气质量数据,其中该历史空气质量数据包括大气臭氧浓度;并将相同时间的该空气质量数据和该气象数据进行匹配,得到匹配数据;
[0013]训练模块,用于根据起报时刻t前h时刻到起报时刻t内的气象和空气质量数据,预测t后x时刻的大气臭氧浓度为划分目标,将匹配数据划分为监督回归预测数据,以该监督回归预测数据训练回归预测模型,得到大气臭氧浓度预测模型;
[0014]预测模块,用于将待预测时刻前h时刻到该待预测时刻内的气象和空气质量数据输入该大气臭氧浓度预测模型,得到该待预测时刻后x时刻的大气臭氧浓度作为大气臭氧浓度的预测结果。
[0015]所述的一种基于回归预测模型的大气臭氧浓度的预测系统,其中该回归预测模型为XGBoost模型;
[0016]所述的一种基于回归预测模型的大气臭氧浓度的预测系统,其中该气象数据为温度、湿度、风速和气压数据,该空气质量数据为O3、PM2.5、PM10、SO2、NO2和CO浓度数据。
[0017]所述的一种基于回归预测模型的大气臭氧浓度的预测系统,其中该初始模块还用于对历史气象数据和历史空气质量数据进行预处理,预处理内容包括:对历史气象数据和历史空气质量数据中的缺失值和错误值进行补齐处理。
[0018]本专利技术还提出了一种存储介质,用于存储执行所述任意一种基于回归预测模型的大气臭氧浓度的预测方法的程序。
[0019]本专利技术还提出了一种客户端,用于所述任意一种基于回归预测模型的大气臭氧浓度的预测系统。
[0020]由以上方案可知,本专利技术的优点在于:
[0021](1)本专利技术提供的一种基于XGBoost算法的空气质量预测方法,将XGBoost模型引入到空气质量预测问题中,基于历史空气质量数据和历史气象数据,实现对单个观测站空气质量参数的短期精准预测和中长期趋势预测;通过不断积累新的空气质量数据和气象数据提升XGBoost模型的预测精度;
[0022](2)传统的空气质量预测方法仅能预测PM10、PM2.5等主要参数项,预测能力有限,而本专利技术提供的空气质量预测方法能够预测所有的空气质量参数,便于观察分析空气质量的变化情况;
[0023](3)传统的空气质量预测方法需要融合大量复杂的数学、物理、化学模型,计算过程需要在专用服务器上处理,且计算周期较长,而本专利技术提供的空气质量预测方法,对计算平台要求较低,且响应速度快。
附图说明
[0024]图1为本专利技术基于XGBoost算法的空气质量预测方法中整体建模流程图;
[0025]图2为实例中O3浓度的历史观测值;
[0026]图3为本专利技术空气质量预测方法的预测值与实测值对比图;
[0027]图4为本专利技术空气质量预测方法的预测误差示意图;
[0028]图5为本专利技术方法流程图;
[0029]图6为本专利技术模型输入输出预测示意图。
具体实施方式
[0030]为让本专利技术的上述特征和效果能阐述的更明确易懂,下文特举实施例,并配合说明书附图作详细说明如下。
[0031]大气污染的影响因素复杂,包括气象因素、地形因素等,各观测站测量值包括PM2.5、PM10、O3等多个表征,是一个复杂的多输入、多输出的时序问题,难以用精确的数学模型进行描述。各级观测站得到的观测数据目前只提供了参考作用,无法提供精准的空气质量实时预警,观测站得到的海量数据并未挖掘出其背后真实的关联关系,而人工智能恰恰是一个基于大数据进行信息深度挖掘的技术,完美地契合了大气污染预警预本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于回归预测模型的大气臭氧浓度的预测方法,其特征在于,包括:步骤1、获取同一地区的历史气象数据和历史空气质量数据,其中该历史空气质量数据包括大气臭氧浓度;并将相同时间的该空气质量数据和该气象数据进行匹配,得到匹配数据;步骤2、根据起报时刻t前h时刻到起报时刻t内的气象和空气质量数据,预测t后x时刻的大气臭氧浓度为划分目标,将匹配数据划分为监督回归预测数据,以该监督回归预测数据训练回归预测模型,得到大气臭氧浓度预测模型;步骤3、将待预测时刻前h时刻到该待预测时刻内的气象和空气质量数据输入该大气臭氧浓度预测模型,得到该待预测时刻后x时刻的大气臭氧浓度作为大气臭氧浓度的预测结果。2.如权利要求1所述的一种基于回归预测模型的大气臭氧浓度的预测方法,其特征在于,该回归预测模型为XGBoost模型。3.如权利要求1所述的一种基于回归预测模型的大气臭氧浓度的预测方法,其特征在于,该气象数据为温度、湿度、风速和气压数据,该空气质量数据为O3、PM2.5、PM10、SO2、NO2和CO浓度数据。4.如权利要求1所述的一种基于回归预测模型的大气臭氧浓度的预测方法,其特征在于,该步骤1包括对历史气象数据和历史空气质量数据进行预处理,预处理内容包括:对历史气象数据和历史空气质量数据中的缺失值和错误值进行补齐处理。5.一种基于回归预测模型的大气臭氧浓度的预测系统,其特征在于,包括:初始模块,用于获取同一地区的历史气象数据和历史空气质量...

【专利技术属性】
技术研发人员:赵越赵晓宏卓俊玲郝少阳徐海红
申请(专利权)人:生态环境部环境工程评估中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1