估计目标变量对结果变量的因果效应的方法、装置和系统制造方法及图纸

技术编号:21572714 阅读:29 留言:0更新日期:2019-07-10 15:42
本发明专利技术公开了一种估计目标变量对结果变量的因果效应的方法、装置和系统。根据本公开的方法,利用观测数据,针对给定的目标变量确定目标变量的相关变量集合,所述相关变量集合包括与目标变量相关的变量。然而,利用涉及目标变量以及与目标变量相关的变量的观测数据,对包括目标变量以及与目标变量相关的变量的局部因果网络进行学习,从而得到目标变量的经过学习的局部因果网络。接着,根据在目标变量的经过学习的局部因果网络中指示的目标变量与结果变量之间的关系,来确定目标变量对结果变量的直接因果效应和总因果效应其中至少一个。利用本公开,可以大大缩减因果效应评价所需的时间,显著提高因果效应评价的效率,并针对因果效应给出定量评价。

Methods, devices and systems for estimating causal effects of target variables on outcome variables

【技术实现步骤摘要】
估计目标变量对结果变量的因果效应的方法、装置和系统
本公开涉及数据挖掘的
,更特别地涉及一种用于估计目标变量对结果变量的因果效应的方法、装置和系统。
技术介绍
在大数据时代,可以通过各种数据采集途径获得大量的数据。通过对这些数据进行数据分析与挖掘,可以得到很多有用的信息。然而,在众多应用领域中,人们往往只能看到系统的表象,却无法洞察系统背后复杂的作用机理及作用过程,而是仅能获得经验型的理解。因果结构学习致力于基于系统的观测数据,学习和发现多变量之间的因果关系,自动还原系统背后复杂的作用机理,再现数据生成过程。目前,因果结构学习技术已被应用于制药、制造、市场分析、决策等多个领域,以便洞察系统本质,继而指导决策,创造价值。因果网络通常被用来定性地描述多变量之间的因果关系,其是对因果关系网络的一种形式化描述,能够反映出数据产生的机制,并给出给出哪些数据是由哪些数据产生的具体过程。为了了解因果关系,通常需要利用大量数据对因果网络进行学习,在因果结构学习中可以采用各种类型的模型,其中比较常用的包括结构方程模型、布尔可满足因果模型和贝叶斯网络因果模型。例如I.Tsamardinos,等人在“Themax-minhill-climbingBayesiannetworkstructurelearningalgorithm”(MachineLearning65,31-78,2006)就提出一种用于学习网络结构的MMHC贝叶斯网络结构学习算法.因果效应是原因变量对结果变量的效应的定量描述。因果效应的一个实例是某种医学治疗方法对某种疾病的治疗效果,因果效应的另一实例是某种公司决策对其产生结果的作用等。借助于因果效应,可以针对治疗或决策对于疾病疗效或决策结果做出定量评价。现有技术中,为了获得因果效应,通常需要首先学习一个完整的本质图(Essentialgraph),然后利用局部定向来确定出原因变量的所有可能的局部因果关系,最后再定量评价原因变量对结果变量的可能的总因果效应的集合。MarloesH.Maathuis等人在“Estimatinghigh-dimensionalinterventioneffectsfromobservationaldata,”(AnnalsofStatistics37,3133-3164,2008)提出一种示例的类似因果效应评估方法。根据现有技术中的这种因果效应评价方法,将耗费较长学习时间。另外,该方法虽然能够评价总因果效应,却无法确定直接因果效应。而直接因果效应在实际应用中是非常重要的,其可以用于分析原因变量对结果变量通过各种因果路径所产生的因果效应。为此,在本领域中存在针对因果效应评价的改进技术方案的需求。
技术实现思路
有鉴于此,本公开提出了一种用于估计目标变量对结果变量的因果效应的方法、装置和系统,以至少部分上消除或者缓解现有技术中的问题。根据本公开的第一方面,提供了一种用于估计目标变量对结果变量的因果效应的方法。在该方法中,可以利用观测数据,针对给定的目标变量确定所述目标变量的相关变量集合,所述相关变量集合包括与所述目标变量相关的变量。然后,利用涉及所述目标变量以及与所述目标变量相关的变量的观测数据,对包括所述目标变量以及与所述目标变量相关的变量的局部因果网络进行学习,从而得到所述目标变量的经过学习的局部因果网络。接着,根据在所述目标变量的经过学习的局部因果网络中指示的所述目标变量与所述结果变量之间的关系,来确定所述目标变量对所述结果变量的直接因果效应和总因果效应其中至少一个。根据本公开的第二方面,提供了一种用于估计目标变量对结果变量的因果效应的装置。该装置可以包括相关变量集合确定模块、局部因果网络学习模块和因果效应确定模块。所述相关变量集合确定模块,被配置为利用观测数据,针对给定的目标变量确定所述目标变量的相关变量集合,所述相关变量集合包括与所述目标变量相关的变量。所述局部因果网络学习模块,被配置为利用涉及所述目标变量以及与所述目标变量相关的变量的观测数据,对包括所述目标变量以及与所述目标变量相关的变量的局部因果网络进行学习,从而得到所述目标变量的经过学习的局部因果网络。所述因果效应确定模块,被配置为根据在所述目标变量的经过学习的局部因果网络中指示的所述目标变量与所述结果变量之间的关系,来确定所述目标变量对所述结果变量的直接因果效应和总因果效应其中至少一个。根据本公开的第三方面,提供了一种用于估计目标变量对结果变量的因果效应的系统,所述系统可以包括:处理器,和存储器,所述存储器存储了至少一个或多个计算机程序代码,所述计算机程序代码在被所述处理器执行时,使得所述处理器执行根据本公开的第一方面所述的方法的步骤。根据本公开的第四方面,提供了一种计算机可读存储介质,其上包括有计算机程序代码,当由处理器执行中时,所述计算机程序代码使得所述计算机设备执行根据本公开的第一方面的方法的步骤。根据本公开的第五方面,提供了一种计算程序产品,其上包括有计算机程序代码,当被加载到计算机设备中时,其可以使得该计算机设备执行根据本公开的第一方面的方法的步骤。在本公开的实施方式中,通过借助于局部因果网络学习可以得到与目标变量相关的局部因果网络,进一步基于该局部因果网络中反映出的目标变量与结果变量的不同类型,可以采用相应的方式来确定目标变量对结果变量的直接因果效应或者总因果效应其中至少一个。由此,可以大大缩减因果效应评价所需的时间,显著提高因果效应评价的效率,并针对因果效应给出定量评价。附图说明通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开的附图中相同的标号表示相同或相似的部件。在附图中:图1示意性地示出了根据本公开的一个实施方式的用于估计目标变量对结果变量的因果效应的方法的流程图;图2示意性地示出了示例的整体因果网络的示意图;图3A-3D示意性地示出了根据本公开的一个实施方式的示例局部因果网络的示意图;图4A至图4D示意性地示出了根据本公开的实施方式的在目标变量和结果变量之间存在各种不同关系的情况下的因果效应确定方法;图5A-图5D示意性地示出了用于说明在目标变量和结果变量的父节点集合查找时形成v形结构的示意图;图6A-图6D示意性地示出了用于说明在目标变量和结果变量的父节点集合查找时形成的局部环形结构的示意图;图7示意性地示出了根据本公开的一个实施方式的用于估计目标变量对结果变量的因果效应的装置的方框图;图8示意性地示出了根据本公开的一个实施方式的示例因果效应确定模块的方框图;以及图9示意性地示出了根据本公开的一个实施方式的用于估计估计目标变量对结果变量的因果效应的系统的示意图。具体实施方式在下文中,将参考附图详细描述本公开的各个示例性实施方式。应当注意,这些附图和描述涉及的仅仅是作为示例的优选实施方式。可以应该指出的是,根据随后的描述,很容易设想出此处公开的结构和方法的替换实施方式,并且可以在不脱离本公开要求保护的公开的原理的情况下使用这些替代实施方式。应当理解,给出这些示例性实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。此外在附图中,出于说明的目的,将可选的步骤、模块、模块等以虚线框示出。在此使用的术语本文档来自技高网
...

【技术保护点】
1.一种估计目标变量对结果变量的因果效应的方法,包括:利用观测数据,针对给定的目标变量确定所述目标变量的相关变量集合,所述相关变量集合包括与所述目标变量相关的变量,利用涉及所述目标变量以及与所述目标变量相关的变量的观测数据,对包括所述目标变量以及与所述目标变量相关的变量的局部因果网络进行学习,从而得到所述目标变量的经过学习的局部因果网络,以及根据在所述目标变量的经过学习的局部因果网络中指示的所述目标变量与所述结果变量之间的关系,来确定所述目标变量对所述结果变量的直接因果效应和总因果效应其中至少一个。

【技术特征摘要】
1.一种估计目标变量对结果变量的因果效应的方法,包括:利用观测数据,针对给定的目标变量确定所述目标变量的相关变量集合,所述相关变量集合包括与所述目标变量相关的变量,利用涉及所述目标变量以及与所述目标变量相关的变量的观测数据,对包括所述目标变量以及与所述目标变量相关的变量的局部因果网络进行学习,从而得到所述目标变量的经过学习的局部因果网络,以及根据在所述目标变量的经过学习的局部因果网络中指示的所述目标变量与所述结果变量之间的关系,来确定所述目标变量对所述结果变量的直接因果效应和总因果效应其中至少一个。2.根据权利要求1所述的方法,其中确定所述目标变量对所述结果变量的直接因果效应和总因果效应其中至少一个包括:当所述目标变量的经过学习的局部因果网络指示代表所述目标变量的节点与代表所述结果变量的节点之间不存在边的情况下,执行以下操作其中至少一个:将所述目标变量对所述结果变量的直接因果效应确定为0;以及基于所述目标变量以及所述目标变量的父节点集合,确定所述目标变量对所述结果变量的总因果效应,其中所述目标变量的父节点集合是通过在所述目标变量的经过学习的局部因果网络中进行查找而确定的。3.根据权利要求1或2所述的方法,其中确定所述目标变量对所述结果变量的直接因果效应和总因果效应其中至少一个包括:当所述目标变量的经过学习的局部因果网络指示代表所述结果变量的节点指向代表所述目标变量的节点的情况下,执行以下操作其中至少一个:将所述目标变量对所述结果变量的直接因果效应确定为0;以及将所述目标变量对所述结果变量的总因果效应确定为0。4.根据权利要求1至3其中任一项所述的方法,其中确定所述目标变量对所述结果变量的直接因果效应和总因果效应其中至少一个包括:当所述目标变量的经过学习的局部因果网络指示代表所述目标变量的节点指向代表所述结果变量的节点的情况下,执行以下其中至少一个:基于所述结果变量的父节点集合,确定所述目标变量对所述结果变量的直接因果效应,其中所述结果变量的父节点集合是通过在所述结果变量的经过学习的局部因果网络中进行查找而确定的;以及基于所述目标变量以及所述目标变量的父节点集合,确定所述目标变量对所述结果变量的总因果效应,其中所述目标变量的父节点集合是通过在所述目标变量的经过学习的局部因果网络中进行查找而确定的。5.根据权利要求1至4其中任一项所述的方法,其中确定所述目标变量对所述结果变量的直接因果效应和总因果效应其中至少一个包括:当所述目标变量的经过学习的局部因果网络指示代表所述目标变量的节点与代表所述结果变量的节点存在边但是该边没有方向的情况下,执行以下其中至少一个:基于所述结果变量的父节点集合,确定所述目标变量对所述结果变量的直接因果效应,其中所述结果变量的父节点集合是通过在所述目标变量的经过学习的局部因果网络中进行查找而确定的;基于所述目标变量以及所述目标变量的父节点集合,确定所述目标变量对所述结果变量的总因果效应,其中所述目标变量的父节点集合是通过在所述目标变量的经过学习的局部因果网络中进行查找而确定的。6.根据权利要求5所述的方法,其中所述目标变量的父节点集合和所述结果变量的父节点集合通过以下操作来查找:在所述目标变量的经过学习的局部因果网络中查找所述目标变量与所述结果变量其中一个的父节点集合,在所述目标变量的经过学习的局部因果网络中查找所述目标变量与所述结果变量其中另一个的父节点集合,其中所述目标变量与所述结果变量其中一个的父节点集合被用作查找所述目标变量与所述结果变量其中另一个的父节点集合的约束。7.根据权利要求6所述的方法,其中所述约束包括不允许所述目标变量与所述结果变量其中另一个的父节点集合与所述目标变量与所述结果变量其中一个的父节点集合形成局部环形结构。8.根据权利要求2、4至7其中任一项所述的方法,其中基于所述目标变量以及所述目标变量的父节点集合,确定所述目标变量对所述结果变量的总因果效应包括:基于所述目标变量和所述目标变量的父节点集合,通过用于总因果效应的线性关系模型来确定所述目标变量对所述结果变量的总因果效应。9.根据权利要求4至7所述的方法,其中基于所述结果变量的父节点集合,确定所述目标变量对所述结果变量的直接因果效应进一步包括:基于所述结果变量的父节点集合,通过用于直接因果效应的线性关系模型来确定所述目标变量对所述结果变量的直接因果效应。10.一种估计目标变量对结果变量的因果效应的装置,包括:相关变量集合确定模块,被配置为利用观测数据,针对给定的目标变量确定所述目标变量的相关变量集合,所述相关变量集合包括与所述目标变量相关的变量,局部因果网络学习模块,被配置为利用涉及所述目标变量以及与所述目标变量相关的变量的观测数据,对包括所述目标变量...

【专利技术属性】
技术研发人员:刘春辰刘越何洋波耿直
申请(专利权)人:日本电气株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1