PM2.5预测方法、系统、装置及存储介质制造方法及图纸

技术编号:30442013 阅读:16 留言:0更新日期:2021-10-24 18:30
本申请公开了一种PM2.5预测方法、系统、装置及计算机可读存储介质,包括:获取污染物数据及环境特征因子;利用预先建立的污染预测模型对污染物数据及环境特征因子进行检测,得到污染预测报告;其中,污染预测模型的训练过程包括:利用样本污染物数据及样本环境特征因子对多个模型进行训练得到多个原始预测模型;对多个原始预测模型进行筛选,得到最优预测模型;对最优预测模型进行优化,得到污染预测模型。本申请利用机器学习算法和大数据构建污染预测模型,使得污染预测模型能够结合大数据深度挖掘影响污染物浓度的各因子之间内在的数据关系,建立起能够更为准确的反应空气污染物浓度与影响因子之间复杂机制的预测模型,提高了污染预测的准确度。了污染预测的准确度。了污染预测的准确度。

【技术实现步骤摘要】
PM2.5预测方法、系统、装置及存储介质


[0001]本专利技术涉及计算机
,特别涉及一种PM2.5预测方法、系统、装置及计算机可读存储介质。

技术介绍

[0002]近年来,随着我国可持续发展理念认知的不断深入,在大力开展经济建设的同时,生态文明建设也日益加强,环境污染的防治成为国家发展建设中的一项重要工作,其中的大气污染防治更是成为重中之重,成为了国家发展战略中的一个重大课题。因此为了更好地反映环境污染变化趋势,为环境管理决策提供及时、全面的环境质量信息,预防严重污染事件发生,开展城市空气污染预报研究是十分必要的。
[0003]PM2.5作为我国首要空气污染物之一,组成成分复杂多变,其形成,转化及沉降过程都十分复杂,这给PM2.5的预测带来了很大困难。此外,大气环境是一个典型的复杂巨系统,难以对系统的各个细节进行全局的掌握和分析,且大气中的化学成分会随着大气状态的改变不断发生变化。尽管空气污染预报方法在近几十年取得了长远的发展,对我国的空气污染物的预测以及防治有着重大贡献,但传统的预测方法仍存在一定的不足。
[0004]现有技术中的,数值预报方法存在以下不足:(1)数值预报方法往往适合区域性的空气污染预测,而对于城市范围的空气污染预测,由于复杂的地面流场和湍流结构,难以准确估计城市边界层大气的物化过程,使得预测效果并不尽如人意;(2)数值预报需要十分翔实的污染源资料,由于实际中难以获得,通常采用简单假设或者忽略的方式,导致数值预报准确性受限;(3)数值预报方法计算复杂度高,预测计算耗时较长(通常需要6

12h),致使预报时效性不强。由于理论上的不足以及应用条件的高要求,数值预报方法有待进一步的完善。
[0005]统计预报方法存在以下不足:(1)时间序列分析法和多元线性回归模型法由于对空气污染变化做了较多的假设,并简化了较多的影响因子,使得方法的预报准确性不高;(2)无法对多来源的数据(结构化、非结构化)进行有效融合与分析,无法实现对海量数据的有效全量分析;(3)传统的统计方法由于无法捕获到复杂的非线性关系,其使用场景往往也受限于简单的线性关系。
[0006]为此需要一种预测准确度更高的PM2.5预测方法。

技术实现思路

[0007]有鉴于此,本专利技术的目的在于提供一种PM2.5预测方法、系统、装置及计算机可读存储介质,提高PM2.5预测准确度。其具体方案如下:
[0008]一种PM2.5预测方法,包括:
[0009]获取污染物数据及环境特征因子;
[0010]利用预先建立的污染预测模型对所述污染物数据及所述环境特征因子进行检测,得到污染预测报告;
[0011]其中,所述污染预测模型的训练过程包括:
[0012]预先利用样本污染物数据及样本环境特征因子对多个模型进行训练得到多个原始预测模型;
[0013]对多个原始预测模型进行评估筛选,得到最优预测模型;
[0014]对所述最优预测模型进行迭代优化,得到所述污染预测模型。
[0015]可选的,所述获取污染物数据及环境特征因子的过程,包括:
[0016]获取原始污染物数据及原始环境特征因子;
[0017]对所述原始污染物数据及所述原始环境特征因子中缺测数据进行插值处理,得到所述污染预测模型能够评估的所述污染物数据及所述环境特征因子。
[0018]可选的,所述对所述原始污染物数据及所述原始环境特征因子中缺测数据进行插值处理,得到所述污染预测模型能够评估的所述污染物数据及所述环境特征因子的过程,包括:
[0019]对所述原始污染物数据及所述原始环境特征因子中缺测的连续数据进行插值处理,得到第一插值污染物数据及第一插值环境特征因子;
[0020]对所述原始环境特征因子中非连续值的类别数据利用OneHot方法处理,得到第二插值环境特征因子;
[0021]综合所述第一插值污染物数据、所述第一插值环境特征因子及所述第二插值环境特征因子,得到所述污染预测模型能够评估的所述污染物数据及所述环境特征因子。
[0022]可选的,所述综合所述第一插值污染物数据、所述第一插值环境特征因子及所述第二插值环境特征因子,得到所述污染预测模型能够评估的所述污染物数据及所述环境特征因子的过程,包括:
[0023]综合所述第一插值污染物数据、所述第一插值环境特征因子及所述第二插值环境特征因子,得到数据清洗后的清洗污染物数据及清洗环境特征因子;
[0024]对所述清洗污染物数据及所述清洗环境特征因子进行数据缩放,得到所述污染预测模型能够评估的所述污染物数据及所述环境特征因子。
[0025]可选的,所述污染物数据,包括NO
x
、NO2、SO2和O3;
[0026]所述环境特征因子,包括蒸发量和/或气温和/或相对湿度和/或风速和/或风向和/或气压和/或降雨量和/或太阳辐射和/或能见度和/或大气边界层高度和/或气溶胶光学厚度和/或季节和/或月份和/或交通密度。
[0027]可选的,所述对多个原始预测模型进行评估筛选,得到最优预测模型的过程,包括:
[0028]利用RMSE与R2评价指标,对多个原始预测模型进行评估筛选,得到最优预测模型。
[0029]可选的,所述对所述最优预测模型进行迭代优化,得到所述污染预测模型的过程,包括:
[0030]利用GridSearchCV方法对所述最优预测模型进行迭代优化,得到所述污染预测模型。
[0031]本专利技术还公开了一种PM2.5预测系统,包括:
[0032]污染数据获取模块,用于获取污染物数据及环境特征因子;
[0033]污染检测模块,用于利用预先建立的污染预测模型对所述污染物数据及所述环境
特征因子进行检测,得到污染预测报告;
[0034]其中,所述污染预测模型为预先利用样本污染物数据及样本环境特征因子进行训练得到的。
[0035]本专利技术还公开了一种PM2.5预测装置,包括:
[0036]存储器,用于存储计算机程序;
[0037]处理器,用于执行所述计算机程序以实现如前述的PM2.5预测方法。
[0038]本专利技术还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前述的PM2.5预测方法。
[0039]本专利技术中,PM2.5预测方法,包括:获取污染物数据及环境特征因子;利用预先建立的污染预测模型对污染物数据及环境特征因子进行检测,得到污染预测报告;其中,污染预测模型的训练过程包括:预先利用样本污染物数据及样本环境特征因子对多个模型进行训练得到多个原始预测模型;对多个原始预测模型进行评估筛选,得到最优预测模型;对最优预测模型进行迭代优化,得到污染预测模型。
[0040]本专利技术利用机器学习算法和大数据构建污染预测模型,使得污染预测模型能够结合大数据深度挖掘影响污染物浓度的各因子之间内在的数据关系,建立起能本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种PM2.5预测方法,其特征在于,包括:获取污染物数据及环境特征因子;利用预先建立的污染预测模型对所述污染物数据及所述环境特征因子进行检测,得到污染预测报告;其中,所述污染预测模型的训练过程包括:预先利用样本污染物数据及样本环境特征因子对多个模型进行训练得到多个原始预测模型;对多个原始预测模型进行评估筛选,得到最优预测模型;对所述最优预测模型进行迭代优化,得到所述污染预测模型。2.根据权利要求1所述的PM2.5预测方法,其特征在于,所述获取污染物数据及环境特征因子的过程,包括:获取原始污染物数据及原始环境特征因子;对所述原始污染物数据及所述原始环境特征因子中缺测数据进行插值处理,得到所述污染预测模型能够评估的所述污染物数据及所述环境特征因子。3.根据权利要求2所述的PM2.5预测方法,其特征在于,所述对所述原始污染物数据及所述原始环境特征因子中缺测数据进行插值处理,得到所述污染预测模型能够评估的所述污染物数据及所述环境特征因子的过程,包括:对所述原始污染物数据及所述原始环境特征因子中缺测的连续数据进行插值处理,得到第一插值污染物数据及第一插值环境特征因子;对所述原始环境特征因子中非连续值的类别数据利用OneHot方法处理,得到第二插值环境特征因子;综合所述第一插值污染物数据、所述第一插值环境特征因子及所述第二插值环境特征因子,得到所述污染预测模型能够评估的所述污染物数据及所述环境特征因子。4.根据权利要求3所述的PM2.5预测方法,其特征在于,所述综合所述第一插值污染物数据、所述第一插值环境特征因子及所述第二插值环境特征因子,得到所述污染预测模型能够评估的所述污染物数据及所述环境特征因子的过程,包括:综合所述第一插值污染物数据、所述第一插值环境特征因子及所述第二插值环境特征因子,,得到数据清洗后的清洗污染物数据及清洗环境特征因子;对所述清洗污染物数据及所述清洗环境特征因子进行数...

【专利技术属性】
技术研发人员:黄青蓝黄红娟陈磊毛佳赵婵娟
申请(专利权)人:江苏蓝创智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1