基于动态时空注意力机制的大气环境污染物预测模型制造技术

技术编号:29874484 阅读:18 留言:0更新日期:2021-08-31 23:49
本发明专利技术涉及环境监测技术领域,提出了基于动态时空注意力机制的大气环境污染物预测模型,包括获得S个监测站点污染物的浓度数据、温度数据和湿度数据,构建输入矩阵;对输入矩阵进行一维卷积操作,得到原始序列;构建时空编码器,将原始序列输入时空编码器;添加卷积门控单元控制时空编码器的输出;构建静态注意力机制和动态注意力机制,与时空编码器的输出信息进行融合,得到目标站点的编码信息;构建解码器,解码目标站点的编码信息,输出预测结果。通过上述技术方案,解决了现有技术中空气污染物预测模型预测准确度差的问题。

【技术实现步骤摘要】
基于动态时空注意力机制的大气环境污染物预测模型
本专利技术涉及环境监测
,具体的,涉及基于动态时空注意力机制的大气环境污染物预测模型。
技术介绍
空气污染是影响人类身体健康、生态环境和气候变化的重要公共卫生问题。世界卫生组织(WorldHealthOrganization,WHO)公布的空气污染物主要包括空气动力学直径小于2.5μm的颗粒物(PM2.5),气动力学直径小于10μm的颗粒物(PM10),二氧化硫(SO2),二氧化氮(NO2)以及臭氧(O3)。近些年来,臭氧已经成为继SO2,PM2.5后困扰城市空气质量改善和达标的首要污染物,国内外许多地区的臭氧污染形式严峻,近地面臭氧浓度居高不下,对臭氧污染的防控与治理已经成为各部门需要解决的重要问题。臭氧污染会对人及动植物会产生不可逆的损害,为防止臭氧污染进一步恶化,越来越多的学者们致力于研究臭氧污染的成因与缓解方法。其中,准确实时的臭氧污染时空监测数据是臭氧污染治理的基本保障。为此,政府及企业逐步建立了由空气质量监测站点(AirQualitySensorNode,AQSN)所组成的空气质量监测网络。这些广泛分布监测站点为高精度、高时空分辨率的大气污染监测数据提供可能。时空监测数据的引入为高精度的臭氧浓度预测提供了可能。因此,越来越多的学者开始针对大气污染物时空数据进行挖掘和研究。但针对基于时空数据的臭氧的预测任务仍存在许多挑战,比如:一、环境臭氧浓度的影响因素众多,且臭氧与其前驱体之间的响应关系复杂,非简单的线性关系,这给臭氧预测带来了困难。二、一个监测站点的臭氧浓度会不同程度的受其它站点的污染物浓度值影响,这种影响的大小不仅与站点之间的距离有关,还与风向、风速等动态的气象条件有关,这些都会影响预测的准确性。
技术实现思路
本专利技术提出基于动态时空注意力机制的大气环境污染物预测模型,解决了现有技术中空气污染物预测模型预测准确度差的问题。本专利技术的技术方案如下:包括步骤S100:获得S个监测站点污染物的浓度数据、温度数据和湿度数据,构建输入矩阵[X1,X2,...,Xs,...,XS];步骤S200:对输入矩阵进行一维卷积操作,得到原始序列;步骤S300:构建时空编码器,将原始序列输入时空编码器;步骤S400:添加卷积门控单元控制时空编码器的输出;步骤S500:构建静态注意力机制和动态注意力机制,与时空编码器的输出信息进行融合,得到目标站点的编码信息;步骤S600:构建解码器,解码目标站点的编码信息,输出预测结果。进一步,对输入矩阵进行一维卷积操作,具体为:用m个高度为h,宽度与输入矩阵维度相同的过滤器在时间维度上进行卷积,其中*代表卷积操作,Wk代表第k个卷积核,φ代表激活函数,对站点s进行卷积得到的结果记为卷积模块的输出组成原始序列[C1,C2,...,Cs,...,CS]。进一步,构建时空编码器的步骤,具体包括:步骤S310:采用内积法,在输入矩阵加上时序信息嵌入Te,具体为:步骤S311:计算时刻i与时刻j之间的权重α'ijαij=softmax(α'ij)其中,为计算Query和Key的待训练参数矩阵,分别表示各个监测站点i时刻和j时刻与时序信息嵌入Te相加后的向量,为放缩因子;步骤S312:将各个时刻的输入通过线性变换后加权求和,得到时刻i的编码向量步骤S313:加入多头自注意力机制,多个注意力头并行执行,并通过以LeakyReLU为激活函数的全连接层进行融合,得到时序编码信息:为全连接层的参数,Concat代表拼接操作,h为注意力头的个数;步骤S320:加入空域自注意力机制,在空间维度对各监测站点进行信息融合,具体为:步骤S321:将站点图信息嵌入Ge,并将各个监测站点的空间编码Ge与时序编码信息相加,得到步骤S322:通过变换矩阵将相加后的结果分别映射到不同的空间中做相似度计算:βij=softmax(β'ij)步骤S323:通过权值βij融合站点信息来更新每个监测站点的特征:步骤S324:加入多头自注意力机制,多个注意力头并行执行,并通过以LeakyReLU为激活函数的全连接层进行融合,得到时空编码信息:融合了同一时间不同监测站点的信息。进一步,添加卷积门控单元控制时空编码器的输出,具体为:步骤S410:将原始序列与时空编码信息进行拼接,通过一维卷积操作以及Sigmoid函数得到每一个时间步编码结果的权重ξ:其中,为卷积门控单元中的第k个卷积核;步骤S420:σ表示Sigmoid函数,将权重ξ映射到0,1区间:步骤S430:将时空编码信息与原始序列进行逐项加权,得到要输出的编码信息:进一步,构建静态注意力机制和动态注意力机制,与时空编码器的输出信息进行融合,具体为:步骤S510:根据每个监测站点的空间编码Ge以及目标站点的空间编码计算每个监测站点对应的注意力权重,得到各监测站点与目标站点之间固定的相关关系:ωL=softmax(ω'L)步骤S520:根据注意力权重,将各个监测站点的时空编码信息加权求和得到目标点的静态特征编码:其中,表示站点i的图嵌入表示,ωs代表了站点之间静态的相关关系,即目标站点的静态特征编码;步骤S530:通过特征嵌入的方式表达风速风向动态气象信息,根据风向及风速的大小将气象条件划分成9个离散值,再将其嵌入到高维空间中,得到动态特征编码,时刻i的动态特征编码由Dei表示;步骤S540:计算各监测站点的动态特征编码与空间编码Ge之间的内积,得到动态的相关关系:ωD=softmax(ω'D)步骤S550:计算时空编码器的输出的加权和,得到目标站点的动态信息编码步骤S560:将目标站点静态编码信息与动态编码信息进行融合,并通过卷积门控单元进行加权,得到目标站点的编码信息:WA以及bA为卷积门控单元的参数,通过门控单元可以调整监测站点之间静态以及动态相关关系的影响,站点融合模块的输出为进一步,构建解码器,解码目标站点的编码信息,具体为:解码器被设计成为包含一层GRU层以及一层全连接层的结构:其中,表示目标点臭氧浓度的预测结果,FC表示全连接层,GRU表示门控循环单元。将向量与同一时刻的动态气象编码一同作为解码器输入。本专利技术的工作原理及有益效果为:本专利技术中一维卷积层的作用是解决污染物之间存在的交叉影响,通过提升维度提高模型表达能力,提取特征之间非线性关系;通过构建时空编码器,使模型记住更长的序列信息,通过时域及空域进行交叉编码,增加时域和空域的感受野,通过多头自注意力提高模型的学习能力;进一步,添加卷积门控单元控制时空编码器的本文档来自技高网
...

【技术保护点】
1.基于动态时空注意力机制的大气环境污染物预测模型,其特征在于,包括/n步骤S100:获得S个监测站点污染物的浓度数据、温度数据和湿度数据,构建输入矩阵[X

【技术特征摘要】
1.基于动态时空注意力机制的大气环境污染物预测模型,其特征在于,包括
步骤S100:获得S个监测站点污染物的浓度数据、温度数据和湿度数据,构建输入矩阵[X1,X2,...,Xs,...,XS];
步骤S200:对输入矩阵进行一维卷积操作,得到原始序列;
步骤S300:构建时空编码器,将原始序列输入时空编码器;
步骤S400:添加卷积门控单元控制时空编码器的输出;
步骤S500:构建静态注意力机制和动态注意力机制,与时空编码器的输出信息进行融合,得到目标站点的编码信息;
步骤S600:构建解码器,解码目标站点的编码信息,输出预测结果。


2.根据权利要求1所述的基于动态时空注意力机制的大气环境污染物预测模型,其特征在于,对输入矩阵进行一维卷积操作,具体为:
用m个高度为h,宽度与输入矩阵维度相同的过滤器在时间维度上进行卷积,



其中*代表卷积操作,Wk代表第k个卷积核,φ代表激活函数,对站点s进行卷积得到的结果记为卷积模块的输出组成原始序列[C1,C2,...,Cs,...,CS]。


3.根据权利要求1所述的基于动态时空注意力机制的大气环境污染物预测模型,其特征在于,构建时空编码器的步骤,具体包括:
步骤S310:采用内积法,在输入矩阵加上时序信息嵌入Te,具体为:
步骤S311:计算时刻i与时刻j之间的权重α'ij



αij=softmax(α'ij)
其中,为计算Query和Key的待训练参数矩阵,分别表示各个监测站点i时刻和j时刻与时序信息嵌入Te相加后的向量,为放缩因子;
步骤S312:将各个时刻的输入通过线性变换后加权求和,得到时刻i的编码向量



步骤S313:加入多头自注意力机制,多个注意力头并行执行,并通过以LeakyReLU为激活函数的全连接层进行融合,得到时序编码信息:




dv为全连接层的参数,Concat代表拼接操作,h为注意力头的个数;
步骤S320:加入空域自注意力机制,在空间维度对各监测站点进行信息融合,具体为:
步骤S321:将站点图信息嵌入Ge,并将各个监测站点的空间编码Ge与时序编码信息相加,得到
步骤S322:通过变换矩阵将相加后的结果分别映射到不同的空间中做相似度计算:



βij=softmax(β'ij)
步骤S323:通过权值βij融合站点信息来更新每个监测站点的特征:



步骤S324:加入多头自注意力机制,多个注意力头并行执行,并通过以LeakyReLU为激活函数的全连接层进行融合,得到时空...

【专利技术属性】
技术研发人员:周围张航涛张英俊
申请(专利权)人:北京交通大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1