一种基于数据时空特征的PM2.5浓度预测方法技术

技术编号：26891843 阅读：95 留言：0更新日期：2020-12-29 16:10

本发明专利技术公开了一种基于数据时空特征的PM2.5浓度预测方法，包括采集所有监测站点的PM2.5以及天气数据；对采集到的所有数据进行清洗；进行相关性分析并设置阈值，融合待预测站点与相关系数≥阈值的相邻站点的数据构建模型输入数据；对输入数据进行归一化，将数据序列按照时间步长T滑动切段，得到多个数据分量。基于可以提取数据空间特征的CNN以及时间特征的双向LSTM搭建PM2.5浓度预测模型；使用训练集对模型进行训练，并通过网格搜索法优化得到最佳参数；使用训练好的模型进行PM2.5预测。与现有技术相比，本发明专利技术提出的模型在提高了预测精度的同时，也增加了预测的稳定性，对异常值的鲁棒性更高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于数据时空特征的PM2.5浓度预测方法
本专利技术专利涉及一种PM2.5的浓度预测方法，尤其是涉及一种考虑数据时空特征的PM2.5浓度预测方法。
技术介绍
近年来，环境污染问题受到了广泛关注。特别是由于PM2.5引起的空气污染，已经并将在未来很长一段时间内持续成为亟待解决的重大健康危害。长期生活在严重污染的环境下，人的呼吸系统、心血管系统、生殖系统都会逐渐发生病变。同时这些空气污染物能够散射和吸收可见光，使大气能见度下降进而多诱发交通事故，也影响着人们的正常生活。因此，准确的、稳定的空气质量预测对提前进行区域预警以及减少安全事故至关重要。为了预测PM2.5的浓度，此前，在空气质量预测中主要采用确定性方法和统计方法。确定性方法主要是基于大气的物理和化学模型，采用数学方法建立大气污染浓度的迁移或扩散模型，再通过计算模拟大气污染物浓度的动态变化，最终达到预测浓度的目的。常用的模型比如社区多尺度空气质量模型、WRFChem模型、嵌套式空气质量预测模型系统(NAQPMS)等。然而，这些的模型需要非常丰富的信息数据，而获得...

【技术保护点】
1.一种考虑数据时空特征的PM2.5浓度预测方法，其特征在于，包括以下步骤：/n步骤S1：采集市区内包括待预测站点的所有监测站点的PM2.5以及天气数据；/n步骤S2：对步骤S1中采集到的所有监测站点的PM2.5以及天气数据进行清洗；/n步骤S3：进行相关性分析并设置阈值，融合与待预测站点相关系数≥阈值的相邻站点的数据构建模型输入数据；/n步骤S4：对输入数据进行归一化，将数据序列按照时间步长T滑动切段，得到多个数据分量；并按比例划分为训练集、验证集、测试集；/n步骤S5：基于提取数据空间特征的CNN以及时间特征的双向LSTM搭建PM2.5浓度预测模型；/n步骤S6：使用训练集对PM2.5浓度...

【技术特征摘要】
1.一种考虑数据时空特征的PM2.5浓度预测方法，其特征在于，包括以下步骤：
步骤S1：采集市区内包括待预测站点的所有监测站点的PM2.5以及天气数据；
步骤S2：对步骤S1中采集到的所有监测站点的PM2.5以及天气数据进行清洗；
步骤S3：进行相关性分析并设置阈值，融合与待预测站点相关系数≥阈值的相邻站点的数据构建模型输入数据；
步骤S4：对输入数据进行归一化，将数据序列按照时间步长T滑动切段，得到多个数据分量；并按比例划分为训练集、验证集、测试集；
步骤S5：基于提取数据空间特征的CNN以及时间特征的双向LSTM搭建PM2.5浓度预测模型；
步骤S6：使用训练集对PM2.5浓度预测模型进行训练，并通过网格搜索法优化得到最佳参数；
步骤S7：使用训练好的模型进行PM2.5预测。

2.根据权利要求1所述的考虑数据时空特征的PM2.5浓度预测方法，其特征在于：所述数据清洗过程包括对于连续超过5个小时的数据缺失或者异常的情况，直接剔除数据；对于小于5个小时的数据缺失或异常我们使用上一时刻的值进行填充。

3.根据权利要求1所述的考虑数据时空特征的PM2.5浓度预测方法，其特征在于：步骤S3所述的相关系数，是通过计算待预测站点与其他所有站点PM2.5数据的Pearson相关系数得到的，其计算公式为：

其中，X,Y表示待预测站点以及待比较站...

【专利技术属性】
技术研发人员：雷飞，董学应，马晓鹤，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人