一种面向多元时间序列的因果关系可视分析方法技术

技术编号:37867514 阅读:23 留言:0更新日期:2023-06-15 20:57
本发明专利技术涉及一种面向多元时间序列的因果关系可视分析方法,属于可视化技术领域,包括以下步骤:S1:获取多元时间序列数据集,分别从空间和时间的角度对时间序列进行预处理;S2:应用格兰杰因果关系检验对划分好的多元时间序列进行因果关系测试,使用防抖策略获取稳定的因果关系;S3:设计动态因果图可视化,使分析人员能够沿着时间探索和解释多元时间序列的动态因果关系;S4:考虑因果关系的多个维度,设计定制的因果验证和比较可视化来揭示可疑的因果关系。因果关系。因果关系。

【技术实现步骤摘要】
一种面向多元时间序列的因果关系可视分析方法


[0001]本专利技术属于可视化
,涉及一种面向多元时间序列的因果关系可视分析方法。

技术介绍

[0002]分析因果关系对于理解复杂系统背后的机制和做出导致预期结果的决策至关重要。例如,在大气污染领域,发现空气质量数据集背后的因果关系可以帮助分析人员了解城市污染的原因,辅助制定有效的防治策略。由于控制实验的高成本,大多数现有的分析系统通过相关性分析和共现模式分析来得出因果结论。然而,这些研究得出的模式和见解并不意味着真正的因果关系,其结果的可靠性往往是有限的应用。这一事实促使了因果分析的研究,其目的是从观测数据中建立因果关系模型来推断因果关系。
[0003]近年来,研究人员采用格兰杰因果检验方法捕获时间序列数据之间的因果关系。这些研究试图从一组时间序列中得出一个因果图,其中每一对时间序列之间的因果关系用一个有向边表示。然而,由于城市环境的快速变化,单个因果图不足以刻画多个时序变量之间的动态因果关系。例如,从两个时间序列中检测到的因果关系可能会因某些外部因素(如气象因素中的风速)而消失,甚至会不时反转。这种动态的性质需要从多个尺度来分析因果关系,使分析人员能够根据不同需求任务选择不同的时空尺度,以洞察城市环境中因果关系的时间变化。此外,解释和验证自动化模型检测到的这些因果关系也需要一个交互式系统来将分析人员集成到因果关系分析循环中。

技术实现思路

[0004]有鉴于此,本专利技术的目的在于提供一种面向多元时间序列的因果关系可视分析方法。该方法基于格兰杰因果关系检验提出了一个因果检测框架。该框架包括时空划分和防抖策略,以提高不同城市多元时间序列间的因果检测能力。然后,通过设计一个动态因果图可视化,使分析人员能够沿着时间探索和解释多元时间序列的动态因果关系。之后考虑因果关系的多个维度,并设计了定制的因果验证和比较可视化来揭示可疑的因果关系。最后,通过对真实世界的大气污染数据集和共享单车数据集的两个案例研究,证明了该方法的有效性。本专利技术能够有效地帮助分析人员探索和理解多元时间序列间的动态因果关系。
[0005]为达到上述目的,本专利技术提供如下技术方案:
[0006]一种面向多元时间序列的因果关系可视分析方法,包括以下步骤:
[0007]S1:获取多元时间序列数据集,分别从空间和时间的角度对时间序列进行预处理;
[0008]S2:应用格兰杰因果关系检验对划分好的多元时间序列进行因果关系测试,使用防抖策略获取稳定的因果关系;
[0009]S3:设计动态因果图可视化,使分析人员能够沿着时间探索和解释多元时间序列的动态因果关系;
[0010]S4:考虑因果关系的多个维度,设计定制的因果验证和比较可视化来揭示可疑的
因果关系。
[0011]进一步,步骤S1所述分别从空间和时间的角度对时间序列进行预处理,具体如下:
[0012]在空间上按行政区划分,以城市(地级行政区)为最小单位,将同一城市的数据进行平均化处理;
[0013]在时间上按周期划分,以日或者月为最小单位,将每个时间序列划分为不同的时间窗。
[0014]进一步,步骤S2中所述应用格兰杰因果关系检验对划分好的多元时间序列进行因果关系测试,具体包括:
[0015]两个时间序列X、Y之间的格兰杰因果关系定义为:若采用时间序列X和Y的历史信息对Y进行预测,优于仅采用Y的历史信息对Y进行预测的结果,则认为变量X是变量Y的原因;
[0016]格兰杰因果检验应用向量自回归模型VAR作为预测模型,在VAR中,系统的当前状态通过系统中不同时间序列的过去K个状态来预测;基于以下两个回归方程检验X

Y(X导致Y):
[0017][0018][0019]其中,系数表示第n个变量的前k个时间戳前的值对第i个变量的预测的贡献,表示第i个变量在t时刻的记录值,N为时序变量的个数,K为时间滞后。c为常数项,ε为误差项。如果通过考虑X的记录来改善预测性能,那么X

Y为真;格兰杰因果关系检验通过除X和Y以外的其他所有变量V\{X,Y}消除其他变量的干扰,并聚焦于当前的两个变量;
[0020]通过基于残差平方和(SSR)的F检验确定统计显著性:
[0021][0022]其中,SSR1和SSR2分别表示回归方程(1)和(2)的残差平方和,M为回归样本数,F值服从参数为M和M

KN的F分布,即F~F(K,M

KN);零假设是如果F的p值小于p值阈值j,则拒绝原假设;否则,接受零假设;因果强度用(j

p)/j来衡量。
[0023]进一步,步骤S2中所述使用防抖策略获取稳定的因果关系,具体包括:当用户指定最大时滞K
+
后,系统在每个时间窗进行因果检测,从而得到在每个K≤K
+
下变量间的因果关系;如果某个因果关系出现在所有时间滞后K的因果检测中,则它是稳定的且最终将呈现在因果图中。
[0024]进一步,设计的动态因果图可视化,包括可视化单一因果图,具体包括:
[0025]使用有向无环图来表示从步骤S2中得到的因果关系,其中每个节点都用一个同心圆表示,同心圆的外层表示当前变量,不同的颜色编码不同的变量类型,同心圆的内层是一个饼图,其中每个扇区编码当前变量的一个原因,扇区的颜色映射与外层变量一致;如果一个变量是根原因,则其内层为空白圆;同心圆的大小编码该变量与其他变量的累计相关系数和;每条链接表示一个因果关系,因果方向为从上节点到下节点;因果关系的强度由最有效的线路通道之一的厚度编码;
[0026]因果图中每个节点的位置根据其相关的因果关系来确定,节点的垂直位置高于其在因果图中的每个子节点;
[0027]对于因果图中节点的布局,使用最有效的视觉通道(位置)来编码最重要的信息(方向);通过寻找节点的拓扑排序来解决每个节点的位置布局;将节点放置到不同的层中,其中节点的所有原因都来自前面的层;计算每个节点的层的公式为:
[0028]Layer(v)=max({Layer(v
i
)|v
i
∈Cv(v)})+1
[0029]其中,v表示节点,C(v)表示节点v的所有原因;每个根节点的层设为0;因果方向从上到下;
[0030]对于减少跨层链接,即链接两端节点的层次相差大于1,通过节点内层的扇区来编码原因变量;扇区面积编码原因变量对节点的影响强度大小占比。
[0031]进一步,将厚度编码平均划分为四个级别,再以指数分级。
[0032]进一步,设计的动态因果图可视化,包括可视化多个因果图,具体包括:按时间顺序放置因果图,并设计可视化和交互;在可视化方面设计趋势视图,可视化多个变量的时间变化趋势,并作为因果图的时间轴,使因果图面向时间的下钻分析;在交互方面高亮所有因果图中某一对变量的因果关系的相关路径;通过深度优先遍历算法来寻找满足条件的所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向多元时间序列的因果关系可视分析方法,其特征在于:包括以下步骤:S1:获取多元时间序列数据集,分别从空间和时间的角度对时间序列进行预处理;S2:应用格兰杰因果关系检验对划分好的多元时间序列进行因果关系测试,使用防抖策略获取稳定的因果关系;S3:设计动态因果图可视化,使分析人员能够沿着时间探索和解释多元时间序列的动态因果关系;S4:考虑因果关系的多个维度,设计定制的因果验证和比较可视化来揭示可疑的因果关系。2.根据权利要求1所述的面向多元时间序列的因果关系可视分析方法,其特征在于:步骤S1所述分别从空间和时间的角度对时间序列进行预处理,具体如下:在空间上按行政区划分,以城市为最小单位,将同一城市的数据进行平均化处理;在时间上按周期划分,以日或者月为最小单位,将每个时间序列划分为不同的时间窗。3.根据权利要求1所述的面向多元时间序列的因果关系可视分析方法,其特征在于:步骤S2中所述应用格兰杰因果关系检验对划分好的多元时间序列进行因果关系测试,具体包括:两个时间序列X、Y之间的格兰杰因果关系定义为:若采用时间序列X和Y的历史信息对Y进行预测,优于仅采用Y的历史信息对Y进行预测的结果,则认为变量X是变量Y的原因;格兰杰因果检验应用向量自回归模型VAR作为预测模型,在VAR中,系统的当前状态通过系统中不同时间序列的过去K个状态来预测;基于以下两个回归方程检验X

Y:Y:其中,系数表示第n个变量的前k个时间戳前的值对第i个变量的预测的贡献,表示第i个变量在t时刻的记录值,N为时序变量的个数,K为时间滞后,c为常数项,ε为误差项,如果通过考虑X的记录来改善预测性能,那么X

Y为真;格兰杰因果关系检验通过除X和Y以外的其他所有变量V\{X,Y}消除其他变量的干扰,并聚焦于当前的两个变量;通过基于残差平方和的F检验确定统计显著性:其中,SSR1和SSR2分别表示回归方程(1)和(2)的残差平方和,M为回归样本数,F值服从参数为M和M

KN的F分布,即F~F(K,M

KN);零假设是如果F的p值小于p值阈值j,则拒绝原假设;否则,接受零假设;因果强度用(j

p)/j来衡量。4.根据权利要求3所述的面向多元时间序列的因果关系可视分析方法,其特征在于:步骤S2中所述使用防抖策略获取稳定的因果关系,具体包括:当用户指定最大时滞K
+
后,系统在每个时间窗进行因果检测,从而得到在每个K≤K
+
下变量间的因果关系;如果某个因果关系出现在所有时间滞后K的因果检测中,则它是稳定的且最终将呈现在因果图中。5.根...

【专利技术属性】
技术研发人员:秦红星郑江溢
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1