【技术实现步骤摘要】
估计目标变量对结果变量的因果效应的方法、装置和系统
本公开涉及数据挖掘的
,更特别地涉及一种用于估计目标变量对结果变量的因果效应的方法、装置和系统。
技术介绍
在大数据时代,可以通过各种数据采集途径获得大量的数据。通过对这些数据进行数据分析与挖掘,可以得到很多有用的信息。然而,在众多应用领域中,人们往往只能看到系统的表象,却无法洞察系统背后复杂的作用机理及作用过程,而是仅能获得经验型的理解。因果结构学习致力于基于系统的观测数据,学习和发现多变量之间的因果关系,自动还原系统背后复杂的作用机理,再现数据生成过程。目前,因果结构学习技术已被应用于制药、制造、市场分析、决策等多个领域,以便洞察系统本质,继而指导决策,创造价值。因果网络通常被用来定性地描述多变量之间的因果关系,其是对因果关系网络的一种形式化描述,能够反映出数据产生的机制,并给出给出哪些数据是由哪些数据产生的具体过程。为了了解因果关系,通常需要利用大量数据对因果网络进行学习,在因果结构学习中可以采用各种类型的模型,其中比较常用的包括结构方程模型、布尔可满足因果模型和贝叶斯网络因果模型。例如I.Tsamardinos,等人在“Themax-minhill-climbingBayesiannetworkstructurelearningalgorithm”(MachineLearning65,31-78,2006)就提出一种用于学习网络结构的MMHC贝叶斯网络结构学习算法.因果效应是原因变量对结果变量的效应的定量描述。因果效应的一个实例是某种医学治疗方法对某种疾病的治疗效果,因果效应的另一实例是某种 ...
【技术保护点】
1.一种估计目标变量对结果变量的因果效应的方法,包括:利用观测数据,针对给定的目标变量确定所述目标变量的相关变量集合,所述相关变量集合包括与所述目标变量相关的变量,利用涉及所述目标变量以及与所述目标变量相关的变量的观测数据,对包括所述目标变量以及与所述目标变量相关的变量的局部因果网络进行学习,从而得到所述目标变量的经过学习的局部因果网络,以及根据在所述目标变量的经过学习的局部因果网络中指示的所述目标变量与所述结果变量之间的关系,来确定所述目标变量对所述结果变量的直接因果效应和总因果效应其中至少一个。
【技术特征摘要】
1.一种估计目标变量对结果变量的因果效应的方法,包括:利用观测数据,针对给定的目标变量确定所述目标变量的相关变量集合,所述相关变量集合包括与所述目标变量相关的变量,利用涉及所述目标变量以及与所述目标变量相关的变量的观测数据,对包括所述目标变量以及与所述目标变量相关的变量的局部因果网络进行学习,从而得到所述目标变量的经过学习的局部因果网络,以及根据在所述目标变量的经过学习的局部因果网络中指示的所述目标变量与所述结果变量之间的关系,来确定所述目标变量对所述结果变量的直接因果效应和总因果效应其中至少一个。2.根据权利要求1所述的方法,其中确定所述目标变量对所述结果变量的直接因果效应和总因果效应其中至少一个包括:当所述目标变量的经过学习的局部因果网络指示代表所述目标变量的节点与代表所述结果变量的节点之间不存在边的情况下,执行以下操作其中至少一个:将所述目标变量对所述结果变量的直接因果效应确定为0;以及基于所述目标变量以及所述目标变量的父节点集合,确定所述目标变量对所述结果变量的总因果效应,其中所述目标变量的父节点集合是通过在所述目标变量的经过学习的局部因果网络中进行查找而确定的。3.根据权利要求1或2所述的方法,其中确定所述目标变量对所述结果变量的直接因果效应和总因果效应其中至少一个包括:当所述目标变量的经过学习的局部因果网络指示代表所述结果变量的节点指向代表所述目标变量的节点的情况下,执行以下操作其中至少一个:将所述目标变量对所述结果变量的直接因果效应确定为0;以及将所述目标变量对所述结果变量的总因果效应确定为0。4.根据权利要求1至3其中任一项所述的方法,其中确定所述目标变量对所述结果变量的直接因果效应和总因果效应其中至少一个包括:当所述目标变量的经过学习的局部因果网络指示代表所述目标变量的节点指向代表所述结果变量的节点的情况下,执行以下其中至少一个:基于所述结果变量的父节点集合,确定所述目标变量对所述结果变量的直接因果效应,其中所述结果变量的父节点集合是通过在所述结果变量的经过学习的局部因果网络中进行查找而确定的;以及基于所述目标变量以及所述目标变量的父节点集合,确定所述目标变量对所述结果变量的总因果效应,其中所述目标变量的父节点集合是通过在所述目标变量的经过学习的局部因果网络中进行查找而确定的。5.根据权利要求1至4其中任一项所述的方法,其中确定所述目标变量对所述结果变量的直接因果效应和总因果效应其中至少一个包括:当所述目标变量的经过学习的局部因果网络指示代表所述目标变量的节点与代表所述结果变量的节点存在边但是该边没有方向的情况下,执行以下其中至少一个:基于所述结果变量的父节点集合,确定所述目标变量对所述结果变量的直接因果效应,其中所述结果变量的父节点集合是通过在所述目标变量的经过学习的局部因果网络中进行查找而确定的;基于所述目标变量以及所述目标变量的父节点集合,确定所述目标变量对所述结果变量的总因果效应,其中所述目标变量的父节点集合是通过在所述目标变量的经过学习的局部因果网络中进行查找而确定的。6.根据权利要求5所述的方法,其中所述目标变量的父节点集合和所述结果变量的父节点集合通过以下操作来查找:在所述目标变量的经过学习的局部因果网络中查找所述目标变量与所述结果变量其中一个的父节点集合,在所述目标变量的经过学习的局部因果网络中查找所述目标变量与所述结果变量其中另一个的父节点集合,其中所述目标变量与所述结果变量其中一个的父节点集合被用作查找所述目标变量与所述结果变量其中另一个的父节点集合的约束。7.根据权利要求6所述的方法,其中所述约束包括不允许所述目标变量与所述结果变量其中另一个的父节点集合与所述目标变量与所述结果变量其中一个的父节点集合形成局部环形结构。8.根据权利要求2、4至7其中任一项所述的方法,其中基于所述目标变量以及所述目标变量的父节点集合,确定所述目标变量对所述结果变量的总因果效应包括:基于所述目标变量和所述目标变量的父节点集合,通过用于总因果效应的线性关系模型来确定所述目标变量对所述结果变量的总因果效应。9.根据权利要求4至7所述的方法,其中基于所述结果变量的父节点集合,确定所述目标变量对所述结果变量的直接因果效应进一步包括:基于所述结果变量的父节点集合,通过用于直接因果效应的线性关系模型来确定所述目标变量对所述结果变量的直接因果效应。10.一种估计目标变量对结果变量的因果效应的装置,包括:相关变量集合确定模块,被配置为利用观测数据,针对给定的目标变量确定所述目标变量的相关变量集合,所述相关变量集合包括与所述目标变量相关的变量,局部因果网络学习模块,被配置为利用涉及所述目标变量以及与所述目标变量相关的变量的观测数据,对包括所述目标变量...
【专利技术属性】
技术研发人员:刘春辰,刘越,何洋波,耿直,
申请(专利权)人:日本电气株式会社,
类型:发明
国别省市:日本,JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。