【技术实现步骤摘要】
基于有效转移熵的高维时间序列因果结构构建方法及系统
[0001]本专利技术涉及计算机数据处理
,具体而言,涉及一种基于有效转移熵的高维时间序列因果结构构建方法、系统、电子设备及计算机存储介质。
技术介绍
[0002]相关性与因果性往往是被相互混淆的。对时间序列数据而言,相关与自相关的概念由来已久且非常重要,但与非时序数据分析一样,相关性和因果性常常是被互换使用的。但二者有着本质的不同。随着大数据时代的到来和因果理论的逐渐完善,针对观测数据的因果分析已经发展为一个重要的研究课题。
[0003]Granger因果分析是一种定性的时间序列因果分析方法。该方法基于Wiener提出的预测理论,其基本思想是:对于时间序列变量X和Y,如果X和Y共同建立的向量自回归(Vector Auto
‑
Regressive,VAR)模型比变量Y单独建立的VAR模型有更高的预测精度(更小的预测误差),则称X为Y的Granger原因。Granger因果关系分析方法可以识别变量间的非对称影响关系,具有一定的可解释性,但只能适用于两变量、平稳、线性的时间序列。为了克服上述缺点,很多变体和拓展方法被提了出来,使其能够拓展到多变量、非线性和非平稳的情形中,但仍然存在计算量大,容易出现虚假因果,是一种定性方法,鲁棒性不强等缺陷。
[0004]基于信息论的因果分析方法可以推断线性和非线性的因果关系,是一种定量的时间序列因果分析方法,而且在离散数据因果关系推断时较其他方法更优越。但其不足之处在于,对高维序列的可靠性较低; ...
【技术保护点】
【技术特征摘要】
1.一种基于有效转移熵的高维时间序列因果结构构建方法,其特征在于,包括如下步骤:获取观测到的高维时间序列T;对所述高维时间序列从因子维度进行第一处理以获得先验因果结构,以及对所述高维时间序列从时间维度进行第二处理以获得嵌入向量;将所述先验因果结构和所述嵌入向量输入图神经网络(GNN),所述GNN输出因子之间的因果结构和预测模型。2.根据权利要求1所述的一种基于有效转移熵的高维时间序列因果结构构建方法,其特征在于:所述对所述高维时间序列从因子维度进行第一处理以获得先验因果结构,包括:对于所述高维时间序列T中的时间序列X、Y,计算由X转到Y的转移熵;基于所述转移熵计算由X转到Y的有效转移熵;基于所述有效转移熵构建先验因果链接矩阵即有向无环图(DAG)。3.根据权利要求2所述的一种基于有效转移熵的高维时间序列因果结构构建方法,其特征在于:由X到Y的转移熵的计算公式如下:式中,H(.|.)是条件熵,k、l是滞后阶数;式中,H(.|.)是条件熵,k、l是滞后阶数;所述转移熵进一步表示为:式中,p(.,.)和p(.|.)分别表示相应的联合分布和条件分布。4.根据权利要求3所述的一种基于有效转移熵的高维时间序列因果结构构建方法,其特征在于:由X到Y的有效转移熵的计算公式如下:式中,X
shuffled
表示对时间序列X随机打乱重新排列而成的新时间序列,其消除了X与Y之间固有或潜在的统计关联或相关关系。5.根据权利要求4所述的一种基于有效转移熵的高维时间序列因果结构构建方法,其特征在于:所述基于所述有效转移熵构建先验因果链接矩阵即有向无环图(DAG),包括:假设所述高维时间序列T=[X1,X2,...,X
d
],其中X
i
=(x
i1
,x
i2
,...,x
it
)
T
为时间序列,t为时间戳;对于该时间序列,相应的先验因果关系构建具体为:初始化图G,设节点V={X1,X2,...,X
d
},所有节点均是分离的;设定显著水平α;对于每个组合(X
i
,X
j
),若其在水平α之下是显著的,则在已有图G中添加X
i
→
...
【专利技术属性】
技术研发人员:陈雪东,徐建程,赵禹平,万宇雷,蒋锐权,
申请(专利权)人:上海金仕达软件科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。