用于估计观测变量之间的因果关系的方法、装置和系统制造方法及图纸

技术编号:20820905 阅读:28 留言:0更新日期:2019-04-10 06:12
公开了一种用于估计观测变量之间的因果关系的方法、装置和系统。根据本公开的方法,响应于接收到观测变量的观测数据,基于对利用所述观测变量进行拟合时的拟合不一致度以及对因果网络结构的稀疏度约束,确定用于因果关系目标式。该拟合不一致度基于观测变量的加权因子进行调整,所述观测变量的加权因子表示使用除该观测变量之外的其他观测变量来拟合目标变量所需的最小成本的下限。然后利用观测数据,通过稀疏因果推理,在有向无环图约束下,对因果关系目标式进行最优化求解,以估计多个观测变量之间的因果关系。利用本公开,可以降低因观测变量估计误差而引起的敏感度,得到更加精确的因果关系。

【技术实现步骤摘要】
用于估计观测变量之间的因果关系的方法、装置和系统
本公开涉及数据挖掘
,更特别地涉及一种用于估计观测变量之间的因果关系的方法、装置和系统。
技术介绍
在大数据时代,可以通过各种数据采集途径获得大量的数据。通过对这些数据进行数据分析与挖掘,可以得到很多有用的信息。然而,在众多应用领域中,人们往往只能看到系统的表象,却无法洞察系统背后复杂的作用机理及作用过程,而是仅能获得经验型的理解。因果结构学习致力于基于系统的观测数据,自动还原系统背后复杂的作用机理,还原数据生成过程。目前,因果结构学习技术已被应用于制药、制造、市场分析等多个领域,以便洞察系统本质,继而指导决策,创造价值。在因果结构学习中可以采用各种类型的模型,其中比较常用的包括结构方程模型、布尔可满足因果模型和贝叶斯网络因果模型。结构方程模型是当前用于因果结构学习的一种流行方法,例如LiNGAM模型,CAM模型,ANM模型等都属于结构方程模型。然而,这种类型的模型需要依赖启发式方法学习因果序列知识,因此会导致因果结构学习精度的损失。布尔可满足因果模型是近年来新提出的用于因果结构学习的一种新方法,它基于布尔逻辑推理精确判定因果结构。然而,此类方法受限于逻辑推理复杂度问题,因果学习时效性较差,且无法应用于观测变量维度较高的复杂因果结构学习。贝叶斯网络因果模型是另一类被广泛运用的方法。传统的贝叶斯因果学习利用准确的推理算法支持因果结构的高精度求解。传统的贝叶斯网络因果模型仅仅适合于中、低维度的因果关系学习,难以应用于高纬度的复杂因果结构学习。而且其推理时效性不好,通常需要利用额外算法来加速推理过程。在JingXiang和SeyoungKim等人发表的“A*LassoforLearningaSparseBayesianNetworkStructureforContinuousVariables”中,提出了一种利用A*Lasso算法来进行因果推理的方式。如图1所示,在该方案中,首先接收观测数据,然后基于使用利用观测变量进行拟合时的拟合不一致度和稀疏约束来执行稀疏因果结构建模,并利用A*Lasso搜索执行因果推理。此外,还通过设定候选因果序列数目的门槛值,来缩减最优因果序列搜索的搜索空间,来加速因果推理。然而,已有的因果建模方法对不同观测变量的估计误差非常敏感当观测变量取值量级存在较大差异或者在对变量的估计存在误差时,因果结构学习的精度会显著下降。此外,已有推理算法时间复杂度高,无法支持观测变量维度较高的复杂因果结构学习。为此,在本领域中存在针对估计观测变量之间的因果关系的新技术方案的需求。
技术实现思路
有鉴于此,本公开提出了一种用于估计观测变量之间的因果关系的方法、装置和系统,以至少部分上消除或者缓解现有技术中的问题。根据本公开的第一方面,提供了一种用于估计观测变量之间的因果关系的方法。在该方法中,可以响应于接收到观测变量的观测数据,基于利用所述观测变量进行拟合时的拟合不一致度以及针对所述观测变量的因果网络结构的稀疏度约束,确定用于所述多个观测变量的因果关系目标式。特别地,所述拟合不一致度基于所述观测变量的加权因子进行调整,所述观测变量的加权因子表示使用除该观测变量之外的其他观测变量来拟合目标变量所需的最小成本的下限。然后,可以利用所述观测数据,通过稀疏因果推理,在有向无环图约束下,对用于所述多个观测变量的因果关系目标式进行最优化求解,以估计所述多个观测变量之间的因果关系。根据本公开的第二方面,提供了一种用于估计观测变量之间的因果关系的装置。该装置可以包括:目标式确定模块和因果推理模块。所述目标式确定模块被配置用于响应于接收到观测变量的观测数据,基于对利用观测变量进行拟合时的拟合不一致度和针对所述观测变量的因果网络结构的稀疏度约束,确定用于所述多个观测变量的因果关系目标式。特别地,所述拟合不一致度基于所述观测变量的加权因子进行调整,所述观测变量的加权因子表示使用除该观测变量之外的其他观测变量来拟合目标变量所需的最小成本的下限。所述因果推理模块可以被配置用于利用所述观测数据,通过稀疏因果推理,在有向无环图约束下,对用于所述多个观测变量的因果关系目标式进行最优化求解,以估计所述多个观测变量之间的因果关系。根据本公开的第三方面,提供了一种用于估计观测变量之间的因果关系的系统,所述系统可以包括:处理器,和存储器,所述存储器存储了至少一个或多个计算机程序代码,所述计算机程序代码在被所述处理器执行时,使得所述处理器执行根据本公开的第一方面所述的方法的步骤。根据本公开的第四方面,提供了一种计算机可读存储介质,其上包括有计算机程序代码,当由处理器执行中时,所述计算机程序代码使得所述计算机设备执行根据本公开的第一方面的方法的步骤。根据本公开的第五方面,提供了一种计算程序产品,其上包括有计算机程序代码,当被加载到计算机设备中时,其可以使得该计算机设备执行根据本公开的第一方面的方法的步骤。在本公开的实施方式中,通过借助于观测变量的加权因子对拟合不一致度进行调整,可以显著缩小观测变量取值量级的差异,从而降低因观测变量估计的误差而引起的敏感度。在进一步的实施方式中,还可以采用基于变量组序列关系的搜索空间剪切技术来实现对搜索空间的剪切,加速优化问题的求解。附图说明通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开的附图中相同的标号表示相同或相似的部件。在附图中:图1示意性地示出了现有技术中的一种用于因果关系估计的技术方案;图2示意性地示出了根据本公开的一个实施方式的用于估计观测变量之间的因果关系的方法的流程图;图3示意性地示出了根据本公开的一个实施方式的用于稀疏因果关系推理的方法的流程图;图4示意性地示出了根据本公开的另一实施方式的用于稀疏因果关系推理的方法的流程图;图5示意性地示出了根据本公开的一个实施方式的用于生成变量组序列关系的方法的流程图;图6A-6C示意性地示出了根据本公开的一个实施方式的生成变量组序列关系过程中的示例父关系图、强联通组件及其新有向无环图;图7示意性地示出了根据本公开的一个实施方式的用于估计观测变量之间的因果关系的装置的流程图;以及图8示意性地示出了根据本公开的一个实施方式的用于估计观测变量之间的因果关系的系统的示意图。具体实施方式在下文中,将参考附图详细描述本公开的各个示例性实施方式。应当注意,这些附图和描述涉及的仅仅是作为示例的优选实施方式。可以应该指出的是,根据随后的描述,很容易设想出此处公开的结构和方法的替换实施方式,并且可以在不脱离本公开要求保护的公开的原理的情况下使用这些替代实施方式。应当理解,给出这些示例性实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。此外在附图中,出于说明的目的,将可选的步骤、模块、模块等以虚线框示出。在此使用的术语“包括”、“包含”及类似术语应该被理解为是开放性的术语,即“包括/包含但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”。其他术语的相关定义将在下文描述中给出。如前所述,已有的因果建模方法对不同观测变量的估计误差存在较大的敏感度,当本文档来自技高网
...

【技术保护点】
1.一种用于估计观测变量之间的因果关系的方法,包括:响应于接收到观测变量的观测数据,基于利用所述观测变量进行拟合时的拟合不一致度以及针对所述观测变量的因果网络结构的稀疏度约束,确定用于所述多个观测变量的因果关系目标式,其中所述拟合不一致度基于所述观测变量的加权因子进行调整,所述观测变量的加权因子表示使用除该观测变量之外的其他观测变量来拟合目标变量所需的最小成本的下限;以及利用所述观测数据,通过稀疏因果推理,在有向无环图约束下,对用于所述多个观测变量的因果关系目标式进行最优化求解,以估计所述多个观测变量之间的因果关系。

【技术特征摘要】
1.一种用于估计观测变量之间的因果关系的方法,包括:响应于接收到观测变量的观测数据,基于利用所述观测变量进行拟合时的拟合不一致度以及针对所述观测变量的因果网络结构的稀疏度约束,确定用于所述多个观测变量的因果关系目标式,其中所述拟合不一致度基于所述观测变量的加权因子进行调整,所述观测变量的加权因子表示使用除该观测变量之外的其他观测变量来拟合目标变量所需的最小成本的下限;以及利用所述观测数据,通过稀疏因果推理,在有向无环图约束下,对用于所述多个观测变量的因果关系目标式进行最优化求解,以估计所述多个观测变量之间的因果关系。2.根据权利要求1所述的方法,其中将针对所述多个观测变量的因果关系目标式的稀疏因果推理转换为最优因果序列递归求解的问题,其中基于经过所述观测变量的加权因子调整的拟合不一致度和针对所述观测变量的因果网络结构的稀疏度约束,来确定在已排序因果序列中从起始节点至当前节点所花费的成本和从当前节点至目标节点的预测成本。3.根据权利要求1或2所述的方法,其中所述稀疏度约束是L0稀疏约束。4.根据权利要求2所述的方法,进一步包括:在所述最优因果序列递归求解的过程中:针对生成新的候选因果序列,确定其是否与预定的变量组序列关系相冲突;以及如果确定存在冲突,则丢弃生成的所述新候选因果序列。5.根据权利要求4所述的方法,其中所述预定的变量组序列关系是由领域专家给定的。6.根据权利要求4所述的方法,其中所述预定的变量组序列关系是基于所述观测数据自动确定的。7.根据权利要求6所述的方法,其中所述预定的变量组序列关系是通过下述操作自动确定的:针对所述观测变量中的每个观测变量,获取其潜在的最优父结点集合;基于获取的所述最优父结点集合,生成父关系图;从所述父关系图中抽取强联通组件;通过将所述强联通组件中的每个组件转换成新节点,并当两个强联通组件在父关系图中具有联通性时,在对应的新节点之间增加相应的边,来将所述父关系图转换成新的有向无环图;以及提取所述有向无环图中的强联通组件之间的序列关系,以作为所述预定的变量组序列关系。8.一种用于估计观测变量之间的因果关系的装置,包括:目标式确定模块,响应于接收到观测变量的观测数据,基于利用所述观测变量进行拟合时的拟合不一致度和针对所述观测变量的因果网络结构的稀疏度约束,确定用于所述多个观测变量的因果关系目标式,其中所述拟合不...

【专利技术属性】
技术研发人员:刘春辰冯璐卫文娟
申请(专利权)人:日本电气株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1