【技术实现步骤摘要】
一种基于局部格兰杰因果分析的因果网络学习方法
[0001]本专利技术属于数据挖掘
,涉及一种基于局部格兰杰因果分析的因果网络学习方法,旨在对气象等领域的高维数据中各变量之间的关系进行探究。
技术介绍
[0002]多元时间序列是一组按照时间分布的多个变量的离散观测集合,其广泛存在于金融、工业、交通、气象等多个领域。例如,大气污染研究领域,近年来,随着我国工业的高速发展以及交通工具的增多,使得大气中因煤、油等燃烧产生的有害物质浓度明显增高,造成空气质量下降和雾霾天气等现象的发生。雾霾天气是一种大气污染状态,是对大气中各种悬浮颗粒物含量超标的笼统表述,尤其PM2.5(空气动力学当量直径小于等于2.5微米的颗粒物)被认为是造成雾霾天气的元凶。PM2.5等空气污染物不仅造成大气能见度差,从而导致交通拥堵等社会问题,还可以通过被吸入人体而对人的身体健康造成危害。因此,针对PM2.5等空气污染物进行建模,刻画空气质量指标(AQI)间的因果关系,实现根据各变量的当前和历史时刻状态,对下一步可能出现的现象进行预测,从而为大气污染防治提供 ...
【技术保护点】
【技术特征摘要】
1.一种基于局部格兰杰因果分析的因果网络学习方法,其特征在于,具体步骤如下:步骤1:获取空气质量指标AQI和气象观测数据;对多维AQI和气象的时间序列数据进行预处理;采用单位根检验方法对时间序列数据进行平稳性检验;再对时间序列数据进行归一化处理;步骤2:通过赤池信息准则确定步骤1处理得到的时间序列数据的最大滞后阶数τ
max
,生成历史变量矩阵X
‑
;其中,表示当前t时刻的数据,τ
max
是最大滞后阶数,d表示变量个数,n表示样本个数;步骤3:利用PC算法,以每个变量为目标进行特征选择处理,得到每个变量的相关特征子集其中,变量为t采样时刻采集的数据,i=1,2,
…
,d;每个变量由其相关特征子集进行表示,如下式(2)所示:其中,f
i
(
·
)表示映射函数,表示偏差;步骤4:将相关特征子集作为条件集送入到局部格兰杰因果分析模型,得到定量的因果关系值,具体为:步骤4.1:选择驱动变量和目标变量通过特征选择方法从时间序列的历史变量矩阵X
‑
中分别找到二者最相关的特征子集:和将变量的特征子集向后平滑一位,得到对应的的特征子集;步骤4.2:将驱动变量和目标变量的相关特征子集作为条件集送入局部格兰杰因果分析模型,如式(3)所示:步骤4.3:加权求和得到驱动变量对目标变量的因果分析结果;步骤5:对局部格兰杰因果分析得到的结果取均值,得到变量间定量的因果关系值,绘制局部格兰杰因果分析的结果得到变量间的动态因果关系曲线;步骤6:得到任一变量与其他变量之间的因果关系,根据因果关系结果选择驱动变量作为目标变量的相关影响因素;利用回声状态网络建立预...
【专利技术属性】
技术研发人员:马德伟,韩敏,秦晓梅,许侃,王钧,
申请(专利权)人:大连理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。