一种基于Bi-GRU的PM2.5数据处理与预测方法技术

技术编号:24331976 阅读:66 留言:0更新日期:2020-05-29 20:03
本发明专利技术公开了一种基于Bi‑GRU的PM2.5数据处理与预测方法,包括以下步骤:构建PM2.5数据的预测模型;利用训练集数据,对所述PM2.5数据的预测模型进行训练;将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;所述预测模型包括Bi‑GRU层、第一全连接层、第二全连接层和第三全连接层,各层之间依次顺序连接,前一层的输出为后一层的输入。本发明专利技术中Bi‑GRU是一种改进的GRU模型,通过连接两个GRU模型形成的一个双向结构,在GRU的基础上能够更加充分的获取序列数据的上下文信息,用于对PM2.5数据的处理和预测有较好的效果。

A PM2.5 data processing and prediction method based on Bi Gru

【技术实现步骤摘要】
一种基于Bi-GRU的PM2.5数据处理与预测方法
本专利技术属于空气污染数据处理与预测
,具体涉及一种基于Bi-GRU(Bidirectional-GatedRecurrentUnit,双向门控循环单元)的PM2.5数据处理与预测方法。
技术介绍
空气污染问题已经成为了社会普遍关注的重要问题之一。每年空气污染会导致300万人死亡,并且这个人数还在不断上升。在中国,雾霾的影响日益增大,其中最为关键的PM2.5及以下的微粒。由于PM2.5在吸入人体以后,其中75%会在肺泡内沉积,导致呼吸系统感染,胎儿发育等严重健康问题。政府一直致力于如何减少空气污染以及对人们健康的影响。一方面,政府通过限制污染企业、提倡绿色清洁能源的使用,努力治理减少空气污染物排放的同时,另一方面通过提前预测未来PM2.5浓度信息发布公众,提醒人们在极端恶劣的条件下减少户外活动,能够给人们的身体健康给与最大限度的保护。因此,对于PM2.5污染浓度的预测研究尤为重要。目前对于PM2.5污染浓度的预测精度仍然不够,难以满足人们的需求。主要采用的方法有基于回归的预测、基于随机森林的预测、基于SVM的预测以及基于神经网络的预测。近年来,随着人工智能技术的发展,越来越多的人发现基于神经网络的预测方法优势较为突出,能够取得较好效果。大量学者采用了LSTM、Con-LSTM方法对空气污染浓度进行了预测,然而精度不够理想。并且实验证明,单纯的增加LSTM或者Con-LSTM单元的个数并不能对预测精度进行提高。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于Bi-GRU的PM2.5数据处理与预测方法,通过连接两个GRU(GatedRecurrentUnit,门控循环单元)模型(正向GRU和反向GRU)形成的一个双向结构,在GRU的基础上能够更加充分的获取序列数据的上下文信息,用于对PM2.5数据的预测有较好的效果。本专利技术的目的是这样实现的,包括以下步骤:步骤1,构建PM2.5数据的预测模型;步骤2,利用训练集数据,对所述PM2.5数据的预测模型进行训练;步骤3,将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;所述预测模型包括Bi-GRU层、第一全连接层、第二全连接层和第三全连接层,各层之间依次顺序连接,前一层的输出为后一层的输入,所述Bi-GRU层由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构,所述Bi-GRU层输出两个合并的GRU信号,所述的第一全连接层的输出层为100,所述的第二全连接层的输出层为10,所述的第三全连接层的输出层为1;所述训练集数据包括影响因素数据和已知的PM2.5观测数据;所述的测试集数据为待预测的PM2.5数据的影响因素数据。具体地,所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据;所述时间分为白天和黑夜2栏;所述的季节分为春季、夏季、秋季、冬季4栏,风向分为东风、南风、西风、北风、无风5栏;其中,predictionHours是一个预设参数,代表预测未来predictionHours小时的PM2.5浓度。优选地,对所述训练集数据根据不同时间或季节进行分类,使用不同类别的训练集分别训练不同类型下的PM2.5数据的预测模型;预测模型训练完成以后,针对当前测试集数据,利用测试集数据对应类型的预测模型,计算获得PM2.5的预测值。具体地,所述的BI-GRU层中正向GRU模型的中间输出反向GRU模型的中间输出对正向GRU模型和反向GRU模型的中间输出的聚合操作,得到输出表示将正向GRU模型的输出与反向GRU模型输出进行合并连接,作为所述的BI-GRU层的输出;其中z1t、为正向GRU模型的中间值,z2t、为反向GRU模型的中间值。具体地,步骤1中所述预测模型的输出值为所述输出值为未来predictionHours后的PM2.5浓度,W12o和B12o为模型参数,通过训练可得。优选地,所述预测模型中的损失函数采用标准归一化MSE,激活函数采用Relu函数,步骤2的训练过程中,通过Adam函数进行学习,得到参数神经网络参数模型。本专利技术方法中的Bi-GRU层是一种改进的GRU模型,通过连接两个GRU模型(正向GRU和反向GRU)形成的一个双向结构,在GRU的基础上能够更加充分的获取序列数据的上下文信息,用于对PM2.5的预测有较好的效果。附图说明图1为本专利技术方法的流程示意图;图2为本专利技术方法的预测模型结构图;图3为本专利技术实施例中GRU的结构图;图4为本专利技术实施例中Bi-GRU模型的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,一种基于Bi-GRU的PM2.5数据处理与预测方法,包括以下步骤:步骤1,构建PM2.5数据的预测模型;步骤2,利用训练集数据,对所述PM2.5数据的预测模型进行训练;步骤3,将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;如图2所示,所述预测模型包括Bi-GRU层、第一全连接层、第二全连接层和第三全连接层,各层之间依次顺序连接,前一层的输出为后一层的输入,所述Bi-GRU层由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构,所述Bi-GRU层输出两个合并的GRU信号,所述的第一全连接层的输出层为100,所述的第二全连接层的输出层为10,所述的第三全连接层的输出层为1;所述训练集数据包括影响因素数据和已知的PM2.5观测数据;所述的测试集数据为待预测的PM2.5数据的影响因数数据。具体地,所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据;所述时间分为白天和黑夜2栏;所述的季节分为春季、夏季、秋季、冬季4栏,风向分为东风、南风、西风、北风、无风5栏;其中,predictionHours是一个预设参数,代表预测未来predictionHours小时的PM2.5浓度。优选地,对所述训练集数据根据不同时间或季节进行分类,使用不同类别的训练集分别训练不同类型下的PM2.5数据的预测模型;预测模型训练完成以后,针对当前测试集数据,利用测试集数据对应类型的预测模型,计算获得PM2.5的预测值。GRU模型是传统的在LSTM模型上的一个改进版,其基本结构如图3所示,其中包含了遗忘门和更新门两个主要处理本文档来自技高网...

【技术保护点】
1.一种基于Bi-GRU的PM2.5数据处理与预测方法,其特征在于,包括以下步骤:/n步骤1,构建PM2.5数据的预测模型;/n步骤2,利用训练集数据,对所述PM2.5数据的预测模型进行训练;/n步骤3,将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;/n所述预测模型包括Bi-GRU层、第一全连接层、第二全连接层和第三全连接层,各层之间依次顺序连接,前一层的输出为后一层的输入,所述Bi-GRU层由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构,所述Bi-GRU层输出两个合并的GRU信号,所述的第一全连接层的输出层为100,所述的第二全连接层的输出层为10,所述的第三全连接层的输出层为1;/n所述训练集数据包括影响因素数据和已知的PM2.5观测数据;/n所述的测试集数据为待预测的PM2.5数据的影响因数数据。/n

【技术特征摘要】
1.一种基于Bi-GRU的PM2.5数据处理与预测方法,其特征在于,包括以下步骤:
步骤1,构建PM2.5数据的预测模型;
步骤2,利用训练集数据,对所述PM2.5数据的预测模型进行训练;
步骤3,将测试集数据输入训练完毕的PM2.5数据的预测模型中,计算获得PM2.5的预测值;
所述预测模型包括Bi-GRU层、第一全连接层、第二全连接层和第三全连接层,各层之间依次顺序连接,前一层的输出为后一层的输入,所述Bi-GRU层由一个正向GRU模型和一个反向GRU模型并联形成一个双向结构,所述Bi-GRU层输出两个合并的GRU信号,所述的第一全连接层的输出层为100,所述的第二全连接层的输出层为10,所述的第三全连接层的输出层为1;
所述训练集数据包括影响因素数据和已知的PM2.5观测数据;
所述的测试集数据为待预测的PM2.5数据的影响因数数据。


2.根据权利要求1所述的PM2.5数据处理与预测方法,其特征在于,所述影响因素数据包括predictionHours前历史PM2.5数据、光照强度、露点温度、空气湿度、气压、温度、风速、每小时降雨量、8小时历史总降雨量、时间、季节、风向共20栏数据;所述时间分为白天和黑夜2栏;所述的季节分为春季、夏季、秋季、冬季4栏,风向分为东风、南风、西风、北风、无风5栏;其中,predictionHours是一个预设参...

【专利技术属性】
技术研发人员:马武彬鲁赢吴继冰邓苏黄宏斌吴亚辉刘丽华李璇
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1