用于确定因果关系的方法、系统和计算机程序产品技术方案

技术编号:20820907 阅读:41 留言:0更新日期:2019-04-10 06:12
本公开内容的实现方式涉及用于确定因果关系的方法、系统和计算机程序产品。提供了一种确定多个变量之间的因果关系的方法,包括:响应于采集到与多个变量相关联的多个样本的数据集,获取描述多个变量之间的因果关系的矩阵,多个样本中的每个样本包括对应于多个变量的数据;基于数据集以及矩阵,确定与因果关系相关联的拟合度以及专家知识约束,其中专家知识约束包括针对矩阵中的两个变量之间的直接因果关系的边约束以及针对矩阵中的两个变量之间的间接因果关系的路径约束中的至少任一项;根据确定的拟合度和专家知识约束构建描述因果关系的问题公式;以及针对构建的问题公式进行求解以获得矩阵的候选结果。进一步,提供了相应系统和计算机程序产品。

【技术实现步骤摘要】
用于确定因果关系的方法、系统和计算机程序产品
本公开内容的各实现方式涉及概率模型,更具体地,涉及用于确定因果关系的方法、系统和计算机程序产品。
技术介绍
概率模型是基于概率推理而获得的图形化网络模型,在此概率推理是指通过分析采集到的对应于多个变量的信息来获得这些变量之间的关联关系。贝叶斯网络(Bayesiannetwork)是为了解决不定性和不完整性问题而提出的一种概率模型,目前已经在多个领域中获得广泛应用。贝叶斯网络可以采用有向无环图(DirectedAcyclicGraph,DAG)来描述多个变量之间的因果关系,该DAG可以包括代表变量的节点以及代表变量之间的因果关系的有向边和路径。例如,由父节点指向其子节点的有向边可以表示:父节点所代表的变量与子节点所代表的变量之间具有直接因果关系。又例如,从一个节点指向另一节点的路径可以表示:两个节点所代表的变量之间具有间接因果关系。贝叶斯网络适用于表达和分析具有不确定性和概率性的事件,并且可以从采集到的对应于多个变量的不完全、不精确或不确定的信息来确定。目前已经开发出了基于采集到的数据集以及专家知识来确定因果关系的技术方案,然而这些技术方案对于专家知识的要求过于苛刻,或者在确定因果关系的过程中可能会涉及到与专家的交互。因而,如何基于专家知识(可能并不完善),以简单有效的方式确定多个变量之间的因果关系成为一个研究热点。
技术实现思路
专家知识在一定程度上可以提高单纯基于数据集确定的多个变量之间的因果关系的准确性。因而,期望开发并实现一种能够以更为准确并有效的方式来基于专家知识确定因果关系的技术方案。并且期望该技术方案能够尽可能地将专家知识用于指导因果关系的学习的过程。根据本专利技术的第一方面,提供了用于确定多个变量之间的因果关系的方法。方法包括:响应于采集到与多个变量相关联的多个样本的数据集,获取描述多个变量之间的因果关系的矩阵,多个样本中的每个样本包括对应于多个变量的数据;基于数据集以及矩阵,确定与因果关系相关联的拟合度以及专家知识约束,其中专家知识约束包括针对矩阵中的两个变量之间的直接因果关系的边约束以及针对矩阵中的两个变量之间的间接因果关系的路径约束中的至少任一项;根据确定的拟合度和专家知识约束构建描述因果关系的问题公式;以及针对构建的问题公式进行求解以获得矩阵的候选结果。根据本专利技术的第二方面,提供了一种用于确定多个变量之间的因果关系的系统,包括:一个或者多个处理器;耦合至一个或者多个处理器中的至少一个处理器的存储器;在存储器中存储的计算机程序指令,当由至少一个处理器执行计算机程序指令时,使得系统执行用于确定多个变量之间的因果关系的方法。该方法包括:响应于采集到与多个变量相关联的多个样本的数据集,获取描述多个变量之间的因果关系的矩阵,多个样本中的每个样本包括对应于多个变量的数据;基于数据集以及矩阵,确定与因果关系相关联的拟合度以及专家知识约束,其中专家知识约束包括针对矩阵中的两个变量之间的直接因果关系的边约束以及针对矩阵中的两个变量之间的间接因果关系的路径约束中的至少任一项;根据确定的拟合度和专家知识约束构建描述因果关系的问题公式;以及针对构建的问题公式进行求解以获得矩阵的候选结果。根据本专利技术的第三方面,提供了一种用于确定多个变量之间的因果关系的设备。该设备包括:获取模块,配置用于响应于采集到与多个变量相关联的多个样本的数据集,获取描述多个变量之间的因果关系的矩阵,多个样本中的每个样本包括对应于多个变量的数据;确定模块,配置用于基于数据集以及矩阵,确定与因果关系相关联的拟合度以及专家知识约束,其中专家知识约束包括针对矩阵中的两个变量之间的直接因果关系的边约束以及针对矩阵中的两个变量之间的间接因果关系的路径约束中的至少任一项;构建模块,配置用于根据确定的拟合度和专家知识约束构建描述因果关系的问题公式;以及求解模块,配置用于针对构建的问题公式进行求解以获得矩阵的候选结果。根据本专利技术的第四方面,提供了一种包括计算机可读存储介质的计算机程序产品,计算机可读存储介质具有存储在其中的计算机可读程序,其中当计算机可读程序在计算设备上被执行时使得计算设备执行如上文所述的用于确定多个变量之间的因果关系的方法。采用本专利技术的用于确定多个变量之间的因果关系的技术方案,可以基于专家知识来分别针对有向图中的边和路径给出相应的约束,进而可以更为准确地确定因果关系。附图说明结合附图并参考以下详细说明,本专利技术各实现方式的特征、优点及其他方面将变得更加明显,在此以示例性而非限制性的方式示出了本专利技术的若干实现方式。在附图中:图1示意性示出了适于实现本专利技术实现方式的示例性计算系统的框图;图2示意性示出了根据本公开内容的一个实现方式的用于确定多个变量之间的因果关系的框图;图3示意性示出了根据本公开内容的一个实现方式的用于确定多个变量之间的因果关系的方法的流程图;图4示意性示出了根据本公开内容的一个实现方式的与矩阵相关联的有向图的示例;图5示意性示出了根据本公开内容的一个实现方式的用于确定专家知识约束的方案的框图;图6示意性示出了根据本公开内容的一个实现方式基于边知识矩阵、路径知识矩阵来确定边知识矩阵和所述路径知识矩阵中的各个元素的框图;图7示意性示出了根据本公开内容的一个实现方式的用于确定从一个状态到达目标状态的评分的框图;以及图8示意性示出了根据本公开内容的一个实现方式的用于确定多个变量之间的因果关系的设备的框图。具体实施方式下面将参照附图更详细地描述本公开的优选实现方式。虽然附图中显示了本公开的优选实现方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实现方式所限制。相反,提供这些实现方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整的传达给本领域的技术人员。图1示出了适于用来实现本公开实现方式的示例性计算系统100的框图。如图1所示,计算机系统100可以包括:CPU(中央处理单元)101、RAM(随机存取存储器)102、ROM(只读存储器)103、系统总线104、硬盘控制器105、键盘控制器106、串行接口控制器107、并行接口控制器108、显示控制器109、硬盘110、键盘111、串行外部设备112、并行外部设备113和触摸屏显示器114。在这些设备中,与系统总线104耦合的有CPU101、RAM102、ROM103、硬盘控制器105、键盘控制器106、串行控制器107、并行控制器108和显示控制器109。硬盘110与硬盘控制器105耦合,键盘111与键盘控制器106耦合,串行外部设备112与串行接口控制器107耦合,并行外部设备113与并行接口控制器108耦合,以及触摸屏显示器114与显示控制器109耦合。应当理解,图1所示的结构框图仅仅是为了示例的目的,而不是对本公开范围的限制。在某些情况下,可以根据具体情况增加或减少某些设备。所属
的技术人员知道,本公开可以实现为系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实现方式中,本公开还可以实现为在一个或多个计算机可读介质中的计算机程本文档来自技高网
...

【技术保护点】
1.一种用于确定多个变量之间的因果关系的方法,包括:响应于采集到与所述多个变量相关联的多个样本的数据集,获取描述所述多个变量之间的所述因果关系的矩阵,所述多个样本中的每个样本包括对应于所述多个变量的数据;基于所述数据集以及所述矩阵,确定与所述因果关系相关联的拟合度以及专家知识约束,其中所述专家知识约束包括针对所述矩阵中的两个变量之间的直接因果关系的边约束以及针对所述矩阵中的两个变量之间的间接因果关系的路径约束中的至少任一项;根据确定的所述拟合度和所述专家知识约束构建描述所述因果关系的问题公式;以及针对构建的所述问题公式进行求解以获得所述矩阵的候选结果。

【技术特征摘要】
1.一种用于确定多个变量之间的因果关系的方法,包括:响应于采集到与所述多个变量相关联的多个样本的数据集,获取描述所述多个变量之间的所述因果关系的矩阵,所述多个样本中的每个样本包括对应于所述多个变量的数据;基于所述数据集以及所述矩阵,确定与所述因果关系相关联的拟合度以及专家知识约束,其中所述专家知识约束包括针对所述矩阵中的两个变量之间的直接因果关系的边约束以及针对所述矩阵中的两个变量之间的间接因果关系的路径约束中的至少任一项;根据确定的所述拟合度和所述专家知识约束构建描述所述因果关系的问题公式;以及针对构建的所述问题公式进行求解以获得所述矩阵的候选结果。2.根据权利要求1所述的方法,其中所述确定所述专家知识约束包括确定所述边约束,包括:基于专家知识确定所述多个变量中的两个变量之间的直接因果关系的状态的边约束矩阵;以及基于所述边约束矩阵和所述矩阵确定所述边约束。3.根据权利要求2所述的方法,其中所述确定所述专家知识约束包括确定所述路径约束,包括:基于所述专家知识确定所述多个变量中的两个变量之间的间接因果关系的状态的路径约束矩阵;以及基于所述路径约束矩阵和所述矩阵确定所述路径约束。4.根据权利要求3所述的方法,其中所述基于所述路径约束矩阵和所述矩阵确定所述路径约束包括:基于所述矩阵,确定描述所述多个变量中的两个变量之间的路径的路径矩阵;以及基于所述路径知识矩阵、所述路径矩阵和所述矩阵确定所述路径约束。5.根据权利要求4所述的方法,其中所述确定所述路径矩阵包括:确定关联于长度为K的路径的K长度路径矩阵,其中所述K长度路径矩阵表示关联于所述矩阵的有向图中的两个节点之间的长度为K的路径的状态,其中K≤p-1,p表示所述多个变量的个数;以及基于所述K长度路径矩阵确定所述路径矩阵。6.根据权利要求4所述的方法,其中确定所述边约束矩阵包括:基于所述专家知识确定描述所述多个变量中的两个变量之间的直接因果关系的状态的边知识矩阵;以及基于所述边知识矩阵确定所述边约束矩阵。7.根据权利要求6所述的方法,其中所述确定所述边知识矩阵包括:针对所述边知识矩阵中的元素,响应于所述专家知识指示与所述元素相关联的第一变量和第二变量之间具有直接因果关系,将所述元素设置为满足第一条件;响应于所述专家知识指示所述第一变量和所述第二变量之间不具有直接因果关系,将所述元素设置为满足第二条件;以及响应于所述专家知识不具有所述第一变量和所述第二变量之间的直接因果关系的知识,将所述元素设置为满足第三条件。8.根据权利要求6所述的方法,其中所述确定所述路径知识矩阵包括:针对所述路径知识矩阵中的元素,响应于所述专家知识指示与所述元素相关联的第一变量和第二变量之间具有间接因果关系,将所述元素设置为满足第一条件;响应于所述专家知识指示所述第一变量和所述第二变量之间不具有间接因果关系,将所述元素设置为满足第二条件;以及响应于所述专家知识不具有所述第一变量和所述第二变量之间的间接因果关系的知识,将所述元素设置为满足第三条件。9.根据权利要求6所述的方法,其中所述基于所述边知识矩阵确定所述边约束矩阵包括:针对所述边约束矩阵中的元素,响应于所述边知识矩阵中与所述元素相对应的元素等于0,将所述边约束矩阵中的所述元素设置为较大值;响应于所述边知识矩阵中与所述元素相对应的元素满足第一条件,将所述边约束矩阵中的所述元素设置为零;以及响应于所述边知识矩阵中与所述元素相对应的元素满足第三条件,将所述边约束矩阵中的所述元素设置为与预定义的超参数相关联。10.根据权利要求9所述的方法,其中将所述边约束矩阵中的所述元素设置为与预定义的超参数相关联包括:将所述边约束矩阵中(j,i)位置处的元素设置为其中是基于所述数据集计算的预定义的超参数,ols表示最小二乘运算,||表示绝对值运算,γ表示预定参数。11.根据权利要求6所述的方法,其中确定所述路径约束矩阵包括:基于所述专家知识确定描述所述多个变量中的两个变量之间的间接因果关系的状态的路径知识矩阵;以及基于所述路径知识矩阵确定所述路径约束矩阵。12.根据权利要求11所述的方法,其中所述基于所述路径知识矩阵确定所述路径约束矩阵包括:针对所述路径约束矩阵中的元素,响应于所述路径知识矩阵中与所述元素相对应的元素等于0,将所述路径约束矩阵中的所述元素设置为较大值;响应于所述路径知识矩阵中与所述元素相对应的元素满足第一条件,将所述路径约束矩阵中的所述元素设置为零;以及响应于所述路径知识矩阵中与所述元素相对应的元素满足第三条件,将所述路径约束矩阵中的所述元素设置为1。13.根据权利要求12所述的方法,其中所述专家知识约束包括与所述矩阵中的当前向量βj相关联的边约束向量和路径约束向量,其中:所述边约束向量为以及所述路径约束向量为14.根据权利要求13所述的方法,其中构建描述所述因果关系的所述问题公式包括:针对所述当前向量βj构建问题公式向量:其中Supp(βj)表示所述当前向量βj的支撑,Qs表示与所述多个元素中的至少一部分元素相关联的因果序列,xj表示多个样本中的与当前向量βj相关联的部分,x-j表示多个样本中的与当前向量βj以外的向量相关联的部分,表示二范数运算,表示所述边约束矩阵中(j,i)位置处的元素,βji表示所述矩阵中(j,i)位置处的元素,表示所述路径约束矩阵中(j,i)位置处的元素,pvi表示所述路径矩阵中(j,i)位置处的元素,βjv表示所述矩阵中(j,v)位置处的元素,||表示绝对值运算,表示Qs中的在节点i之后的节点。15.根据权利要求14所述的方法,其中所述针对构建的所述问题公式进行求解以获得所述矩阵的候选结果包括:针对所述问题公式向量进行求解以获得针对所述矩阵的所述当前向量βj的候选结果。16.一种用于确定多个变量之间的因果关系的系统,包括:一个或者多个处理器;耦合至所述一个或者多个处理器中的至少一个处理器的存储器;在所述存储器中存储的计算机程序指令,当由所述至少一个处理器执行所述计算机程序指令时,使得所述系统执行...

【专利技术属性】
技术研发人员:冯璐刘春辰卫文娟
申请(专利权)人:日本电气株式会社
类型:发明
国别省市:日本,JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1