一种基于图卷积网络的多站点预测方法技术

技术编号:27061689 阅读:40 留言:0更新日期:2021-01-15 14:42
本发明专利技术公开了一种基于图卷积网络的多站点预测方法,获取相关大气能见度数据,再数据获取之后对这些数据进行清洗。并进行预处理。基于图卷积网络的预测模型,对照实验使用相同配置进行预测,最终对比结果。本发明专利技术基于图卷积网络进行改进,利用图卷积处理非欧数据的优势,提出了在空间和时间维度的特征提取工作,之后引入注意力机制来提升模型效果的原因。通过实验准确性对比结果可以得出,本发明专利技术提出的方法在多站点大气能见度预测上相较于其他模型有一定的提升。

【技术实现步骤摘要】
一种基于图卷积网络的多站点预测方法
本专利技术属于机器学习
,尤其涉及到基于图卷积网络等相关深度学习技术进行多站点的大气能见度预测任务。
技术介绍
大气能见度与人们的日常生活息息相关,它的好坏可以在一定程度上反映一个地区大气环境质量的高低。近年来大气能见度下降、空气质量变差,较多城市常伴有雾霾天气,对人们的生活和工作都产生了较大的负面影响,因此空气质量问题受到了政府和人们的高度关注。对于多站点大气能见度的精确预测能够保证交通安全,尤其对低能见度天气信息的预测可以使人们有针对性地控制和预防空气污染事件的发生、减少污染天气造成的各种损失,这对于交通运营管理部门、广大出行市民和保持良好的空气环境都具有积极的意义。此外,近年来随着数据收集和存储成本的下降以及机器学习技术的快速发展,大部分地区的各类气象数据都可以被精确地观测以及存储,这为气象领域的科学研究提供了丰富的数据和算法研究的基础。神经网络自2012年以来迅猛发展,其中深度学习技术在计算机视觉和自然语言处理两个研究领域内的研究成果取得多项突破。对比传统方法在进行图片分类任务时需要人工手动提取特征,然后将特征输入分类器最终得到分类结果的这一系列步骤,深度学习技术(如卷积神经网络)可以达到直接将图片按照固定的编码格式输入模型,最终直接输出该图片所属的预测标签。这样可以将特征提取和分类这两个步骤合二为一,同时避免了人工提取特征这种繁琐的操作,后者是一种端到端(end-to-end)的学习,相较于传统方法可以学习到更高纬度的特征与模式,并且在提升准确度的同时降低了人工耗时。卷积神经网络适用的数据类型比较有限,它要求输入数据必须限制在欧式域内。而欧式数据最显著的特征就这类数据具有规则的空间结构,例如图像是规整的正方形栅格,语音是规则的一维序列数据,并且这些数据可以用矩阵表示。而在现实情况中,比如电子交易、脑信号、推荐系统以及本研究中的多站点的大气能见度预测问题,其中的数据大多都不具备规则的空间结构,称之为非欧数据。在这些数据结构中每个节点连接都不尽相同,也就是说每个节点的度都可能不同。为了将卷积操作移植到这种非欧数据上来,出现了图卷积网络(GraphConvolutionNetwork,GCN),一般地,图卷积网络都有如下三个步骤,一是发射,即每一个节点会将自己的特征信息经过变换之后发射给邻接节点,这可以达到对每个节点的特征信息进行抽取变换的目的,第二步是接受,每个节点将邻接节点的特征信息聚集起来,从而对节点的局部结构信息进行融合,最后一个步骤是变换,也就是把之前的信息聚集起来然后进行非线性变换,达到增加模型的表达能力的目的。此外GCN模型也同样具备深度学习的三种性质,分别是层级结构(特征一层一层抽取,一层比一层更为抽象和高级),非线性变换(增加模型的表达能力)以及端对端训练,也就是不需要再去定义任何规则,只需要给图的节点一个标记,便可让模型自己学习,融合特征信息和结构信息。当然,GCN也具有卷积神经网络的共有性质,其一为局部参数共享,二是感受域正比于层数,在开始第一层计算的时候,每个节点包含了各自直属邻接节点的信息,在计算第二层时就能把二阶邻居的信息也包含进来,这样参与运算的信息就更多更充分,也就是说层数越多,感受域越广,参与运算的信息也就更多。
技术实现思路
本专利技术要解决的技术问题是,提供一种基于图卷积网络的多站点预测方法,使用到的数据集为16个站点大气能见度相关数据。本专利技术采用的技术方案为一种基于图卷积网络的多站点预测方法,该方法包括以下步骤:步骤1、获取相关大气能见度数据,包括2018年至2019年北京市16个城区小时级别的体感温度、温度、风力、湿度、降水量、大气压强和大气能见度七个特征。用于收集能见度数据的设备是前向散射能见度计,其型号为DNQ1,安装地点覆盖北京市16个市区,包括怀柔区、密云区、延庆区、昌平区、顺义区、平谷区、门头沟区、房山区、大兴区、通州区、石景山区、丰台区、海淀区、东城区、西城区和朝阳区。测量的纬度和经度范围是115.7°E-117.4°E,39.4°N-41.6°N。再数据获取之后对这些数据进行清洗。步骤2、针对步骤一中收集到的大气能见度数据中的数据缺失、不平滑等情况对数据进行预处理。步骤3、基于图卷积网络的预测模型,利用进行预处理步骤后的实验数据构建训练集和测试集,在实验过程中利用梯度下降进行超参数的优化进而得到预测模型的最优解。步骤4、对照实验使用相同配置进行预测,最终对比结果。作为优选,步骤2具体包括以下步骤:步骤2.1、针对数据中的缺失值,利用前后时刻平均值填充来进行补全;步骤2.2、针对不平稳的时间序列,通过一阶差分处理的方法转化成平稳序列;步骤2.3、基于16个气象站点所在位置,通过两两气象站点之间的地理位置距离构建气象站点的邻接矩阵,作为图卷积网络的另一个输入数据;作为优选,步骤3具体包括以下步骤:步骤3.1、根据数据划分方法将初始数据集分为训练集,验证集和测试集,比例分别为60%、20%和20%。训练集用于训练模型的参数,然后在每一轮迭代后使用验证集测试当前模型的准确性;步骤3.2、模型由两个时空卷积模块组成,每个时空卷积模块由两个时间卷积层和一个空间卷积层构成,通过在时间维度和空间维度分别对输入数据进行卷积操作来提取时间和空间特征,达到更精准预测的目的,另外通过加入注意力机制来实现为输入数据赋予不同权重的目的;步骤3.3、定义损失函数,使用平均绝对误差MAE损失函数和随机梯度下降的Adam版本,此外分别设置12小时作为历史时间步长,3、6、9、12小时为预测时间步长,即用过去12个小时的能见度数据预测未来3、6、9、12小时的大气能见度;步骤3.4、该模型将适用于批量大小为128的512个训练时期,然后训练模型,不断调整超参数,得到模型最优解;作为优选,步骤4具体包括以下步骤:步骤4.1、对照实验模型使用基于seq2seq结构的模型,分别为编码器和解码器均为LSTM的seq2seq-LSTM、编码器和解码器均为LSTM且添加注意力机制的seq2seq-LSTM-AM、编码器和解码器均为GRU的seq2seq-GRU和编码器和解码器均为GRU且添加了注意力机制的seq2seq-GRU-AM;步骤4.2,利用对照实验模型执行相同参数配置的能见度预测,得出结果并进行误差衡量,其中衡量指标选取了MAE、MSE和RMSE,通过图4-图7的实验结果可以看出相比较于seq2seq模型对每一个站点分别进行建模预测来说,本专利技术中的模型无论是在时间还是准确性上,都有一定程度的提升。与现有技术相对,本专利技术具有以下明显优势:本专利技术基于图卷积网络进行改进,利用图卷积处理非欧数据的优势,提出了在空间和时间维度的特征提取工作,之后引入注意力机制来提升模型效果的原因。通过实验准确性对比结果可以得出,本专利技术提出的方法在多站点大气能见度预测上相较于其他模型有一定的提升。附图说明:图1为本专利技术模型中的时本文档来自技高网
...

【技术保护点】
1.一种基于图卷积网络的多站点预测方法,其特征在于:该方法包括以下步骤:/n步骤1、获取气象站点相关大气能见度数据,包括体感温度、温度、风力、湿度、降水量、大气压强和大气能见度七个特征;/n步骤2、针对步骤1中收集到的大气能见度数据中的数据缺失、不平滑情况对数据进行预处理;/n步骤3、基于图卷积网络的预测模型,利用进行预处理后的实验数据构建训练集和测试集,在实验过程中利用梯度下降进行超参数的优化进而得到预测模型的最优解;/n步骤4、对照实验使用相同配置进行预测,最终对比结果。/n

【技术特征摘要】
1.一种基于图卷积网络的多站点预测方法,其特征在于:该方法包括以下步骤:
步骤1、获取气象站点相关大气能见度数据,包括体感温度、温度、风力、湿度、降水量、大气压强和大气能见度七个特征;
步骤2、针对步骤1中收集到的大气能见度数据中的数据缺失、不平滑情况对数据进行预处理;
步骤3、基于图卷积网络的预测模型,利用进行预处理后的实验数据构建训练集和测试集,在实验过程中利用梯度下降进行超参数的优化进而得到预测模型的最优解;
步骤4、对照实验使用相同配置进行预测,最终对比结果。


2.根据权利要求1所述的一种基于图卷积网络的多站点预测方法,其特征在于:步骤2具体包括以下步骤:
步骤2.1、针对数据中的缺失值,利用前后时刻平均值填充来进行补全;
步骤2.2、针对不平稳的时间序列,通过一阶差分处理的方法转化成平稳序列;
步骤2.3、基于16个气象站点所在位置,通过两两气象站点之间的地理位置距离构建气象站点的邻接矩阵,作为图卷积网络的另一个输入数据。


3.根据权利要求1所述的一种基于图卷积网络的多站点预测方法,其特征在于:步骤3具体包括以下步骤:
步骤3.1、根据数据划分方法将初始数据集分为训练集,验证集和测试集,比例分别为60%、20%和20%;训练集用于训练模型的参数,然后在每一轮迭代后使用验证集测试当前模型的准确性;
步骤3.2、模型由两个时...

【专利技术属性】
技术研发人员:刘博贺玺
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1