【技术实现步骤摘要】
一种面向多元时间序列的因果关系可视分析方法
[0001]本专利技术属于可视化
,涉及一种面向多元时间序列的因果关系可视分析方法。
技术介绍
[0002]分析因果关系对于理解复杂系统背后的机制和做出导致预期结果的决策至关重要。例如,在大气污染领域,发现空气质量数据集背后的因果关系可以帮助分析人员了解城市污染的原因,辅助制定有效的防治策略。由于控制实验的高成本,大多数现有的分析系统通过相关性分析和共现模式分析来得出因果结论。然而,这些研究得出的模式和见解并不意味着真正的因果关系,其结果的可靠性往往是有限的应用。这一事实促使了因果分析的研究,其目的是从观测数据中建立因果关系模型来推断因果关系。
[0003]近年来,研究人员采用格兰杰因果检验方法捕获时间序列数据之间的因果关系。这些研究试图从一组时间序列中得出一个因果图,其中每一对时间序列之间的因果关系用一个有向边表示。然而,由于城市环境的快速变化,单个因果图不足以刻画多个时序变量之间的动态因果关系。例如,从两个时间序列中检测到的因果关系可能会因某些外部因素(如气象因素 ...
【技术保护点】
【技术特征摘要】
1.一种面向多元时间序列的因果关系可视分析方法,其特征在于:包括以下步骤:S1:获取多元时间序列数据集,分别从空间和时间的角度对时间序列进行预处理;S2:应用格兰杰因果关系检验对划分好的多元时间序列进行因果关系测试,使用防抖策略获取稳定的因果关系;S3:设计动态因果图可视化,使分析人员能够沿着时间探索和解释多元时间序列的动态因果关系;S4:考虑因果关系的多个维度,设计定制的因果验证和比较可视化来揭示可疑的因果关系。2.根据权利要求1所述的面向多元时间序列的因果关系可视分析方法,其特征在于:步骤S1所述分别从空间和时间的角度对时间序列进行预处理,具体如下:在空间上按行政区划分,以城市为最小单位,将同一城市的数据进行平均化处理;在时间上按周期划分,以日或者月为最小单位,将每个时间序列划分为不同的时间窗。3.根据权利要求1所述的面向多元时间序列的因果关系可视分析方法,其特征在于:步骤S2中所述应用格兰杰因果关系检验对划分好的多元时间序列进行因果关系测试,具体包括:两个时间序列X、Y之间的格兰杰因果关系定义为:若采用时间序列X和Y的历史信息对Y进行预测,优于仅采用Y的历史信息对Y进行预测的结果,则认为变量X是变量Y的原因;格兰杰因果检验应用向量自回归模型VAR作为预测模型,在VAR中,系统的当前状态通过系统中不同时间序列的过去K个状态来预测;基于以下两个回归方程检验X
→
Y:Y:其中,系数表示第n个变量的前k个时间戳前的值对第i个变量的预测的贡献,表示第i个变量在t时刻的记录值,N为时序变量的个数,K为时间滞后,c为常数项,ε为误差项,如果通过考虑X的记录来改善预测性能,那么X
→
Y为真;格兰杰因果关系检验通过除X和Y以外的其他所有变量V\{X,Y}消除其他变量的干扰,并聚焦于当前的两个变量;通过基于残差平方和的F检验确定统计显著性:其中,SSR1和SSR2分别表示回归方程(1)和(2)的残差平方和,M为回归样本数,F值服从参数为M和M
‑
KN的F分布,即F~F(K,M
‑
KN);零假设是如果F的p值小于p值阈值j,则拒绝原假设;否则,接受零假设;因果强度用(j
‑
p)/j来衡量。4.根据权利要求3所述的面向多元时间序列的因果关系可视分析方法,其特征在于:步骤S2中所述使用防抖策略获取稳定的因果关系,具体包括:当用户指定最大时滞K
+
后,系统在每个时间窗进行因果检测,从而得到在每个K≤K
+
下变量间的因果关系;如果某个因果关系出现在所有时间滞后K的因果检测中,则它是稳定的且最终将呈现在因果图中。5.根...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。