因果关系图的构建方法、装置、电子设备和介质制造方法及图纸

技术编号:34471802 阅读:26 留言:0更新日期:2022-08-10 08:46
本公开提供了一种因果关系图的构建方法、装置、电子设备和介质,涉及大数据和自然语言处理等领域。具体实现方案为:对多个观测对象在至少两种观测维度进行检测,得到观测数据集,并根据观测数据集中至少两种观测维度的观测数据,确定对应观测维度的观测变量;根据至少两种观测维度的观测变量,确定用于指示各观测变量之间差异的协方差矩阵,并根据协方差矩阵,确定用于指示各观测变量之间关联性的邻接矩阵,从而可以根据邻接矩阵和至少两种观测维度的观测变量,生成用于指示至少两种观测维度之间因果关系的因果关系图。由此,可以实现根据观测数据集所确定的各观测维度的观测变量,有效构建用于指示各观测维度之间因果关系的因果关系图。因果关系图。因果关系图。

【技术实现步骤摘要】
因果关系图的构建方法、装置、电子设备和介质


[0001]本公开涉及人工智能
,具体涉及大数据和自然语言处理等领域,尤其涉及因果关系图的构建方法、装置、电子设备和介质。

技术介绍

[0002]观测数据,又称原始数据,是指在自然的未被控制的条件下观测到的数据。从观测数据中进行因果发现,推理出数据特征之间的因果关系,被广泛应用于各领域中,比如生物、机器学习、制药、经济学等领域。例如,在医学健康领域,可以根据观测数据中人员的外在症状,来分析人员所患有的疾病。
[0003]从观测数据中抽象出因果关系,通常是通过寻找一个因果关系图,比如DAG(Directed Acyclic Graph,有向无环图),根据DAG确定观测数据中各变量之间的因果关系,其中,DAG中各节点为需要找寻因果关系的变量,如果DAG中的两个节点之间有边,则说明这两个节点对应的变量之间存在因果关系。
[0004]因此,如何根据观测数据识别或构建因果关系图,是非常重要的。

技术实现思路

[0005]本公开提供了一种因果关系图的构建方法、装置、电子设备和本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种因果关系图的构建方法,所述方法包括:对多个观测对象在至少两种观测维度进行检测,以得到观测数据集;根据所述观测数据集中所述至少两种观测维度的观测数据,确定对应观测维度的观测变量;根据所述至少两种观测维度的观测变量,确定用于指示所述至少两种观测维度的观测变量之间差异的协方差矩阵;根据所述协方差矩阵,确定用于指示所述至少两种观测维度的观测变量之间关联性的邻接矩阵;根据所述邻接矩阵和所述至少两种观测维度的观测变量,生成用于指示所述至少两种观测维度之间因果关系的因果关系图。2.根据权利要求1所述的方法,其中,所述根据所述协方差矩阵,确定用于指示所述至少两种观测维度的观测变量之间关联性的邻接矩阵,包括:从所述协方差矩阵中的各对角元中,确定取值最小的目标对角元;确定所述目标对角元在所述协方差矩阵中所处的目标位置;获取设定的第一重排序列,其中,所述第一重排序列用于指示各所述观测变量对应的观测维度在所述因果关系图中的位置;将所述第一重排序列中首个位置处的元素与所述目标位置处的元素进行交换,以得到第二重排序列;根据所述第二重排序列,确定所述邻接矩阵。3.根据权利要求2所述的方法,其中,所述根据所述第二重排序列,确定所述邻接矩阵,包括:根据所述协方差矩阵中所述目标位置处的元素,确定第一上三角矩阵;根据所述第一上三角矩阵,确定所述观测数据集中所述至少两种观测维度的观测变量对应的噪音数据的标准差;根据所述标准差、所述第一上三角矩阵和所述第二重排序列,确定所述邻接矩阵。4.根据权利要求3所述的方法,其中,所述根据所述协方差矩阵中所述目标位置处的元素,确定第一上三角矩阵,包括:根据所述协方差矩阵中所述目标位置处的元素,确定初始的上三角矩阵;根据所述初始的上三角矩阵和所述协方差矩阵,执行设定次数的迭代过程以进行所述上三角矩阵的更新;根据最后一次所述迭代过程中更新得到的上三角矩阵,确定所述第一上三角矩阵。5.根据权利要求4所述的方法,其中,所述设定次数是根据所述观测维度的个数确定的,任意一次所述迭代过程包括:根据所述迭代过程的已执行次数和所述设定次数所确定的区间,确定至少一个候选参数;根据所述至少一个候选参数,从所述协方差矩阵中确定本次执行所述迭代过程的矩阵元素;根据所述至少一个候选参数所选取出的矩阵元素和当前的上三角矩阵,确定各所述候选参数对应的更新参数;
从所述至少一个候选参数对应的更新参数中,确定取值最小的目标更新参数;根据所述目标更新参数,对当前的上三角矩阵增加元素,以确定本次执行所述迭代过程更新得到的上三角矩阵。6.根据权利要求5所述的方法,其中,任意一次所述迭代过程还包括:根据所述目标更新参数对应的候选参数,对所述第二重排序列进行更新;所述根据所述标准差、所述第一上三角矩阵和所述第二重排序列,确定所述邻接矩阵,包括:确定所述第一上三角矩阵中的各对角元中的最小值;在所述最小值未小于目标比值的情况下,根据所述第一上三角矩阵,确定第一严格上三角矩阵;其中,所述目标比值是根据所述标准差和设定参数确定的;根据最后一次所述迭代过程中更新得到的第二重排序列,确定第一重排矩阵;根据所述第一严格上三角矩阵和所述第一重排矩阵,确定所述邻接矩阵。7.根据权利要求6所述的方法,其中,所述根据所述第一上三角矩阵,确定第一严格上三角矩阵,包括:将所述第一上三角矩阵中各对角元的取值置零,得到初始严格上三角矩阵;将所述初始严格上三角矩阵中各元素的取值与设定阈值进行比对;在所述初始严格上三角矩阵中存在至少一个目标元素的情况下,将所述初始严格上三角矩阵中的所述至少一个目标元素的取值置零,以得到所述第一严格上三角矩阵,其中,所述至少一个目标元素的取值未大于所述设定阈值。8.根据权利要求6所述的方法,其中,所述根据所述标准差、所述第一上三角矩阵和所述第二重排序列,确定所述邻接矩阵,还包括:在所述最小值小于所述目标比值的情况下,将最后一次所述迭代过程中更新得到的上三角矩阵作为第二上三角矩阵,并将最后一次所述迭代过程中更新得到的第二重排序列作为第三重排序列;根据所述第三重排序列和所述第二上三角矩阵,执行至少一次循环过程以进行所述第三重排序列和所述第二上三角矩阵的更新;根据最后一次所述循环过程中更新得到的第三重排序列,确定第二重排矩阵;根据最后一次所述循环过程中更新得到的第二上三角矩阵,确定第二严格上三角矩阵;根据所述第二严格上三角矩阵和所述第二重排矩阵,确定所述邻接矩阵。9.根据权利要求8所述的方法,其中,任意一次所述循环过程包括:判断前一次所述循环过程更新得到的第二上三角矩阵中各对角元中的最小的对角元是否小于目标比值;在所述最小的对角元未小于所述目标比值的情况下,结束所述循环过程;在所述最小的对角元小于所述目标比值的情况下,根据所述最小的对角元在前一次所述循环过程更新得到的第二上三角矩阵中所处的第一位置,确定待添加的隐变量在前一次所述循环过程更新得到的第三重排序列中所处的第二位置;在前一次所述循环过程更新得到的第三重排序列中的第二位置处,添加所述隐变量对应的元素值,以得到本次循环过程更新得到的第三重排序列;
根据本次循环过程更新得到的第三重排序列和所述协方差矩阵,确定本次循环过程对应的中间矩阵;根据所述中间矩阵对前一次所述循环过程更新得到的第二上三角矩阵进行更新,以得到本次循环过程更新得到的第二上三角矩阵。10.根据权利要求8所述的方法,其中,所述根据所述邻接矩阵和所述至少两种观测维度的观测变量,生成用于指示所述至少两种观测维度之间因果关系的因果关系图,包括:根据所述邻接矩阵和所述至少两种观测维度的观测变量,确定各隐变量;根据各所述隐变量、所述至少两种观测维度的观测变量以及所述邻接矩阵,构建所述因果关系图。11.根据权利要求3

10中任一项所述的方法,其中,所述根据所述第一上三角矩阵,确定所述观测数据集中所述至少两种观测维度的观测变量对应的噪音数据的标准差,包括:确定所述第一上三角矩阵的逆矩阵中的各对角元的均值;根据所述均值确定所述观测数据集中所述至少两种观测维度的观测变量对应的噪音数据的标准差。12.一种因果关系图的构建装置,所述装置包括:检测模块,用于对多个观测对象在至少两种观测维度进行检测,以得到观测数据集;第一确定模块...

【专利技术属性】
技术研发人员:蔡云峰李旭孙明明李平
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1