基于有效转移熵的高维时间序列因果结构构建方法及系统技术方案

技术编号:37802733 阅读:15 留言:0更新日期:2023-06-09 09:32
本发明专利技术提供了一种基于有效转移熵的高维时间序列因果结构构建方法及系统;其中,所述方法包括:获取观测到的高维时间序列T;对所述高维时间序列从因子维度进行第一处理以获得先验因果结构,以及对所述高维时间序列从时间维度进行第二处理以获得嵌入向量;将所述先验因果结构和所述嵌入向量输入图神经网络(GNN),所述GNN输出因子之间的因果结构和预测模型。本发明专利技术利用数据驱动的因果分析思想,整合从因子维度获取先验的因果关系矩阵和时间维度提取的嵌入向量,并通过图神经网络(GNN)构建得到高维时间序列的因果结构,有助于深入理解变量之间的依存关系和制约机制,从而为实现更好的预测和控制打下基础。现更好的预测和控制打下基础。现更好的预测和控制打下基础。

【技术实现步骤摘要】
基于有效转移熵的高维时间序列因果结构构建方法及系统


[0001]本专利技术涉及计算机数据处理
,具体而言,涉及一种基于有效转移熵的高维时间序列因果结构构建方法、系统、电子设备及计算机存储介质。

技术介绍

[0002]相关性与因果性往往是被相互混淆的。对时间序列数据而言,相关与自相关的概念由来已久且非常重要,但与非时序数据分析一样,相关性和因果性常常是被互换使用的。但二者有着本质的不同。随着大数据时代的到来和因果理论的逐渐完善,针对观测数据的因果分析已经发展为一个重要的研究课题。
[0003]Granger因果分析是一种定性的时间序列因果分析方法。该方法基于Wiener提出的预测理论,其基本思想是:对于时间序列变量X和Y,如果X和Y共同建立的向量自回归(Vector Auto

Regressive,VAR)模型比变量Y单独建立的VAR模型有更高的预测精度(更小的预测误差),则称X为Y的Granger原因。Granger因果关系分析方法可以识别变量间的非对称影响关系,具有一定的可解释性,但只能适用于两变量、平稳、线性的时间序列。为了克服上述缺点,很多变体和拓展方法被提了出来,使其能够拓展到多变量、非线性和非平稳的情形中,但仍然存在计算量大,容易出现虚假因果,是一种定性方法,鲁棒性不强等缺陷。
[0004]基于信息论的因果分析方法可以推断线性和非线性的因果关系,是一种定量的时间序列因果分析方法,而且在离散数据因果关系推断时较其他方法更优越。但其不足之处在于,对高维序列的可靠性较低;存在未观测变量时会推断出很多虚假因果;因果关系显著性判定方法比较缺乏。
[0005]结构化模型的因果分析方法,是一种基于约束的方法,其可以处理高维时间序列因果推断问题,也可以发现非线性的因果关系,已被开发用于时间序列因果网络的重构。其经典算法(Peter

Clerk(PC)或Inductive Causation(IC))虽然适用于高维时间序列,但其鲁棒性较差,某一步的推断错误可能就会使推断结果发生很大改变。
[0006]综上,已有主要的高维时间序列因果分析方法,在适用范围、计算量、可解释性,以及稳定性可靠性等方面或多或少地存在缺点和不足。

技术实现思路

[0007]为了至少解决上述
技术介绍
中存在的技术问题,本专利技术提供了一种临基于有效转移熵的高维时间序列因果结构构建方法、系统、电子设备及计算机存储介质。
[0008]本专利技术的第一方面提供了一种基于有效转移熵的高维时间序列因果结构构建方法,包括如下步骤:
[0009]获取观测到的高维时间序列T;
[0010]对所述高维时间序列从因子维度进行第一处理以获得先验因果结构,以及对所述高维时间序列从时间维度进行第二处理以获得嵌入向量;
[0011]将所述先验因果结构和所述嵌入向量输入GNN,所述GNN输出因子之间的因果结构
和预测模型。
[0012]进一步地,所述对所述高维时间序列从因子维度进行第一处理以获得先验因果结构,包括:
[0013]对于所述高维时间序列T中的时间序列X、Y,计算由X转到Y的转移熵;
[0014]基于所述转移熵计算由X转到Y的有效转移熵;
[0015]基于所述有效转移熵构建先验因果链接矩阵即有向无环图(DAG)。
[0016]进一步地,由X到Y的转移熵的计算公式如下:
[0017][0018]式中,H(.|.)是条件熵,k、l是滞后阶数;
[0019][0020][0021]转移熵进一步表示为:
[0022][0023]式中,p(.,.)和p(.|.)分别表示相应的联合分布和条件分布。
[0024]进一步地,由X到Y的有效转移熵的计算公式如下:
[0025][0026]式中,X
shuffled
表示对时间序列X随机打乱重新排列而成的新时间序列,其消除了X与Y之间固有或潜在的统计关联或相关关系。
[0027]进一步地,所述基于所述有效转移熵构建先验因果链接矩阵即有向无环图(DAG),包括:
[0028]假设所述高维时间序列T=[X1,X2,...,X
d
],其中X
i
=(x
i1
,x
i2
,...,x
it
)
T
为时间序列,t为时间戳;
[0029]对于该时间序列,相应的先验因果关系构建具体为:
[0030]初始化图G,设节点V={X1,X2,...,X
d
},所有节点均是分离的;设定显著水平α;
[0031]对于每个组合(X
i
,X
j
),若其在水平α之下是显著的,则在已有图G中添加X
i

X
j
的边,并记录相应的ET值,直至遍历所有的组合(X
i
,X
j
);
[0032]在获得的赋权图G上应用经典的Peter

Clerk(PC)或Inductive Causation(IC),得到对应的有向无环图G=(V,E)及对应的ET值;
[0033]返回有向无环图G=(V,E)及对应的ET值。
[0034]进一步地,所述对所述高维时间序列从时间维度进行第二处理以获得嵌入向量,包括:
[0035]将所述高维时间序列中的各节点的一维时间序列输入时间卷积网络模型,根据所需的滞后期数,通过因果卷积、空洞卷积,再结合跳层连接和残差模块进行数据融合,最后得到相应的各节点的嵌入向量。
[0036]进一步地,所述对所述高维时间序列从时间维度进行第二处理以获得嵌入向量,包括:
[0037]提取所需视野宽度或滞后期长度的各节点的一维时间序列的位置、尺度、形态、趋势等统计特征,来代替原有一维时间序列作为各节点的嵌入向量。
[0038]进一步地,通过图节点嵌入策略从所述高维时间序列中提取所述嵌入向量。
[0039]进一步地,GNN表示为f(X,A
(0)
),其中X是从时间维度提取的所有节点对应的嵌入向量,A
(0)
则表示从因子维度提取的先验因果链接矩阵对应的有向无环图(DAG)。
[0040]进一步地,所述GNN的迭代更新过程表示为:
[0041][0042]式中,l=0,1,...,L

1,表示图神经网络的层;为第l层的第i个节点的嵌入向量;为第i个节点在图G中的邻居节点;表示对第i个节点的所有邻居节点的整合;ψ(
·
)为节点之间的信息传递函数;φ(
·
)为具有置换不变性的非线性函数;
[0043]上述迭代函数表示为如下具体形式:
[0044][0045]式中,σ(
·
)为sigmoid函数或ReLU函数。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于有效转移熵的高维时间序列因果结构构建方法,其特征在于,包括如下步骤:获取观测到的高维时间序列T;对所述高维时间序列从因子维度进行第一处理以获得先验因果结构,以及对所述高维时间序列从时间维度进行第二处理以获得嵌入向量;将所述先验因果结构和所述嵌入向量输入图神经网络(GNN),所述GNN输出因子之间的因果结构和预测模型。2.根据权利要求1所述的一种基于有效转移熵的高维时间序列因果结构构建方法,其特征在于:所述对所述高维时间序列从因子维度进行第一处理以获得先验因果结构,包括:对于所述高维时间序列T中的时间序列X、Y,计算由X转到Y的转移熵;基于所述转移熵计算由X转到Y的有效转移熵;基于所述有效转移熵构建先验因果链接矩阵即有向无环图(DAG)。3.根据权利要求2所述的一种基于有效转移熵的高维时间序列因果结构构建方法,其特征在于:由X到Y的转移熵的计算公式如下:式中,H(.|.)是条件熵,k、l是滞后阶数;式中,H(.|.)是条件熵,k、l是滞后阶数;所述转移熵进一步表示为:式中,p(.,.)和p(.|.)分别表示相应的联合分布和条件分布。4.根据权利要求3所述的一种基于有效转移熵的高维时间序列因果结构构建方法,其特征在于:由X到Y的有效转移熵的计算公式如下:式中,X
shuffled
表示对时间序列X随机打乱重新排列而成的新时间序列,其消除了X与Y之间固有或潜在的统计关联或相关关系。5.根据权利要求4所述的一种基于有效转移熵的高维时间序列因果结构构建方法,其特征在于:所述基于所述有效转移熵构建先验因果链接矩阵即有向无环图(DAG),包括:假设所述高维时间序列T=[X1,X2,...,X
d
],其中X
i
=(x
i1
,x
i2
,...,x
it
)
T
为时间序列,t为时间戳;对于该时间序列,相应的先验因果关系构建具体为:初始化图G,设节点V={X1,X2,...,X
d
},所有节点均是分离的;设定显著水平α;对于每个组合(X
i
,X
j
),若其在水平α之下是显著的,则在已有图G中添加X
i

...

【专利技术属性】
技术研发人员:陈雪东徐建程赵禹平万宇雷蒋锐权
申请(专利权)人:上海金仕达软件科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1