【技术实现步骤摘要】
Systems.2020: 163
‑
166.DOI:10.1145/3397536.3422208)该研究通过构建图数据结构,将PM2.5 浓度数据与天气变量数据结合,融入PM2.5的领域知识,体现了PM2.5空间上的扩散与传输,使其能够捕捉PM2.5预测时的长期依赖关系。但其构建图数据结构时未能体现城市节点之间的关联,并且未对PM2.5的时序数据进行处理,其预测仅在数据量较大时才较准确,当数据量过少时其预测精度较低。
[0007]学术文献3(刘金培,陈丽娟,汪漂,陈华友.基于MEMD和空间层次聚类的PM2.5三角模糊序列多因子组合预测研究[J/OL].控制与决策:1
‑
9[2022
‑
02
‑
17].DOI:10.13195/j.kzyjc.2021.1163)该研究提出基于多元经验模态分解和空间层次聚类的PM2.5三角模糊序列多因子组合预测模型。运用皮尔曼相关系数分析PM2.5与本地污染物浓度、气象要素间的关联度,选取本地影响因子;其次,计算PM2.5与空间污染物浓度间的关联度,并据此对邻近城市 K
‑
means空间聚类得到核心影响、一般影响和偏远影响城市群,并统计各城市群不同污染物的综合指数,即空间影响因子;进而,利用MEMD对PM2.5和影响因子的三角模糊序列同时进行分解,重构得到高频、低频以及趋势序列。最后,用BP、LSTM、LSSVR分别对子序列进行多输入单输出的预测,最后集成得到计算结果。此研究的局限主要是要求对大气污染数据要求高,并且通过组合预 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习模型与经验模态分解耦合的PM2.5污染浓度长时空预测方法,其特征在于,包括以下步骤:步骤1,收集PM2.5污染数据以及相关气象变量数据,数据清洗并进行相关性分析;通过皮尔逊相关系数进行相关性分析,确定选取的相关气象变量数据与PM2.5污染数据之间的相关性,皮尔逊相关系数公式如下:此为总体相关系数,其中,X、Y指两个随机变量,指PM2.5与单个相关气象变量;单个相关气象变量数据与PM2.5污染数据为总体的样本,cov(X,Y)指PM2.5数据与单个气象变量数据的协方差,σ指样本数据的标准差,E[]指求随机变量的期望,μ指样本数据的均值;对于样本数据,即PM2.5数据以及单个气象变量数据,cov(X,Y)和σ公式为:cov(X,Y)=E[XY]
‑
E[X]E[Y]将其代入到ρ
X,Y
的公式中,得到样本的皮尔逊相关系数r:其中,X
i
,Y
i
指随机变量X,Y中的样本,指单条PM2.5污染数据与单条单个气象变量数据,指PM2.5污染数据与单个气象变量数据的总体均值,n为数据的数量;步骤2,通过步骤1中清洗过的相关气象变量数据,构建图数据结构,并基于注意力机制以及图数据结构,构建模型GAT
‑
EGRU的GAT模块,将PM2.5污染数据以及相关气象变量数据输入,得到新的空间特征信息;步骤2.1,根据步骤1中选取的相关气象变量数据以及关联规则,构建图数据结构,关联规则如下:A
ij
=H(d
θ
‑
d
ij
)
·
H(m
θ
‑
m
ij
)其中,d
ij
=||ρ
i
‑
ρ
j
||,其中,A
ij
代表是否有关联:数值为0时表示无关联,数值为1时表示有关联,ρ
i
代表图数据结构中城市节点i的位置,d
ij
表示两个节点之间的距离;m
ij
表示城市节点i与城市节点j之间的山脉海拔高度,在求解m
ij
的公式中,h(
·
)为高度函数,λ为占比参数,sup{}表示求上界;||
·
||为向量的L2范数,H(
·
)为阶跃函数,当且仅当x>0时,H(x)=1;d
θ
、m
θ
为距离和海拔高度的阈值;步骤2.2,基于GAT的注意力机制以及步骤2.1的图数据结构,构造模型的GAT模块,具体地,构造GAT的公式如下:
其中,a:R
p
′
×
R
p
′
→
R为自注意力机制,W∈R
p
×
p
′
为权重矩阵,M是节点i邻居节点的集合,为节点i的空间特征矩阵,e
ij
表示节点j对节点i的重要性;为了使e
ij
易于在不同节点之间进行比较,使用Softmax函数对j的所有注意力系数进行归一化,得到α
ij...
【专利技术属性】
技术研发人员:杨光飞,张强,关晓微,
申请(专利权)人:大连凌空数据科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。