贝叶斯网络构建方法及装置制造方法及图纸

技术编号:16701246 阅读:22 留言:0更新日期:2017-12-02 13:46
本公开揭示了一种贝叶斯网络构建方法及装置,属于数据处理技术领域。该方法包括:计算第一随机变量与随机变量集合中其他的随机变量之间的互信息,从随机变量集合中筛选出与第一随机变量相关程度较高的随机变量,将这些相关程度较高的随机变量的集合作为第一随机变量的候选父节点集合;获取候选父节点集合的所有子集,利用打分函数对该所有子集中每一个进行评分;从该所有子集中删除不包括第一随机变量的父节点的子集,将剩余子集的并集作为第一随机变量对应的第二变量集合,在第二变量集合中各随机变量对应节点、第一随机变量对应节点间添加有向边。本公开解决了贝叶斯网络构建效率低下的问题,提高了多个随机变量对应的贝叶斯网络的构建效率。

Construction method and device of Bias network

The present disclosure discloses a method and device for the construction of a Bayesian network, which belongs to the field of data processing technology. The method includes: calculating the mutual information between the first set of random variables and random variables in other random variables, from the set of random variables selected random variables associated with the first random variables of the higher degree of the set of random variables which is related to a higher degree of the candidate parent node first set of random variables to obtain the candidate subset of all; the parent node set, the subset of all each score by scoring function; concentrated deleted from the all parent node subset does not include the first random variable, the union of the remaining subset as the first random variables corresponding to the second variables, second variable set of random variables in the corresponding node, the first random variables corresponding to nodes are added to the edge. This disclosure solves the problem of inefficient Bayesian network construction, and improves the construction efficiency of Bayesian networks corresponding to multiple random variables.

【技术实现步骤摘要】
贝叶斯网络构建方法及装置
本公开涉及数据处理
,特别涉及一种贝叶斯网络构建方法及装置。
技术介绍
贝叶斯网络包括多个节点和多个有向边。其中,每个节点表示一个随机变量,每个有向边由一个节点指向另一个节点,该有向边用于指示这两个节点对应随机变量之间的相互关系,也即影响关系。例如,节点A指向节点B,则节点A对应随机变量C的取值对节点B对应随机变量D的取值有影响。目前,技术人员可搜集多条数据,每条数据包括多个随机变量的取值,利用这些数据确定该多个随机变量之间的相互关系,从而生成贝叶斯网络。例如,在某次传染病的爆发过程中,技术人员需要分析传染病的传播规律,以便根据传播规律采取预防和诊治措施,从而降低伤亡和损失。此时,技术人员可搜集多条数据,每条数据为一个已感染病人的感染信息,每条数据包括的随机变量可以包括年龄、性别、发病时间、呼吸住宿以及其他可能导致感染传染病的因素,根据该多条数据确定这些随机变量之间的相互关系,从而生成贝叶斯网络。目前,在为多个随机变量建立贝叶斯网络时,通常基于这些随机变量之间所有可能的相互关系生成多个候选贝叶斯网络。然后,再利用打分函数根据搜集的多条数据对每个候选贝叶斯网络进行打分,候选贝叶斯网络的分数用于指示该候选贝叶斯网络能够正确表达该多个随机变量之间相互关系的可能性,根据候选贝叶斯网络的分数从该多个候选贝叶斯网络中选择一个候选贝叶斯网络,作为该多个随机变量对应的贝叶斯网络。然而,该多个随机变量的数量增大时,生成的候选贝叶斯网络的数量越多,导致建立该多个随机变量对应的贝叶斯网络的效率低下。
技术实现思路
本公开提供一种智能设备控制方法及装置。所述技术方案如下:根据本公开实施例的第一方面,提供一种贝叶斯网络构建方法,所述方法包括:获取随机变量集合以及m条数据,所述随机变量集合包括多个随机变量,所述m条数据中每条数据包括所述多个随机变量中至少一个随机变量的取值,m为正整数;根据所述m条数据计算第一随机变量与第二随机变量之间的互信息,所述互信息用于指示所述第一随机变量与所述第二随机变量之间的关联程度,所述第一随机变量为所述随机变量集合中任一随机变量,所述第二随机变量为第一变量集合中任一随机变量,所述第一变量集合由所述随机变量集合中除所述第一随机变量以外的其他随机变量组成;从所述第一变量集合中获取互信息最大的K个随机变量,组成所述第一随机变量的候选父节点集合,K为正整数;获取所述候选父节点集合的所有子集,根据所述m条数据,并利用打分函数对所述所有子集中每一个进行评分,每一个子集包括的所有随机变量均为所述第一随机变量的父节点的可能性与所述每一个子集的分数呈负相关;在第一子集的分数大于第二子集的分数时,删除所述第一子集,所述第一子集为所述所有子集中的任一个,所述第二子集为所述所有子集中的一个,且所述第二子集为所述第一子集的子集;获取剩余子集,将所述剩余子集的并集作为所述第一随机变量对应的第二变量集合;在第三随机变量对应的节点、所述第一随机变量对应的节点之间添加有向边,所述有向边由所述第三随机变量对应的节点指向所述第一随机变量对应的节点,所述第三随机变量为所述第二变量集合中任一随机变量。可选的,所述根据所述m条数据计算第一随机变量与第二随机变量之间的互信息,包括:利用第一公式计算所述第一随机变量与所述第二随机变量之间的互信息,所述第一公式如下:其中,MulInfo(Xi,Xj)为所述第一随机变量与所述第二随机变量之间的互信息,Xi为所述第一随机变量,xi为所述第一随机变量的一个取值,Vi为所述第一随机变量所有可取数值的集合,Xj为所述第二随机变量,xj为所述第二随机变量的一个取值,Vj为第二随机变量所有可取数值的集合,count(xi,xj)为所述m条数据中同时包括xi、xj的数据的数目,count(xi)为所述m条数据中包括xi的数据的数目,count(xj)为所述m条数据中包括xj的数据的数目。可选的,所述打分函数如下:其中,Pa为所述所有子集中的一个子集,MDL(Xi,Pa)为Pa的分数,xi为所述第一随机变量的一个取值,Vi为所述第一随机变量所有可取数值的集合,pai为Pa的一个取值组合,所述取值组合包括Pa中每个随机变量的取值,Vpa为Pa的所有可取数值的集合,count(xi,pai)为所述m条数据中同时包括xi、pai的数据的数目,count(xi,pai)为所述m条数据中包括pai的数据的数目,ri为所述第一随机变量的所有可取数值的数目,Xpj为Pa中的一个随机变量,rpj为Xpj的所有可取数值的数目。可选的,所述方法还包括:从第一组合中删除包括第三随机变量的子集得到第二组合,所述第一组合包括所述所有子集中剩余的子集;从所述第二组合包括的各个子集的分数中获取最小分数得到第一分数,从所述第一组合包括的各个子集的分数中获取最小分数得到第二分数;将所述第一分数与所述第二分数的差值确定为由所述第三随机变量对应节点指向所述第一随机变量间对应节点的有向边的权重。可选的,所述多个随机变量中每个随机变量对应的节点以及节点之间的有向边组成贝叶斯网络,所述方法还包括:获取所述贝叶斯网络中的任一环,获取所述任一环中权重最小的有向边,所述任一环包括的有向边首尾相连;获取所述权重最小的有向边所指向的终止节点,将所有指向所述终止节点的有向边从所述贝叶斯网络中删除,以及获取所述终止节点对应的随机变量得到第四随机变量,从所述第四随机变量对应的第二变量集合中删除所述权重最小的有向边的起始节点对应的随机变量得到更新后的第二变量集合;重新计算所述更新后的第二变量集合中每个随机变量对应的节点指向所述第四随机变量对应的节点的有向边的权重。根据本公开实施例的第二方面,提供一种贝叶斯网络构建装置,所述装置包括:第一获取模块,用于获取随机变量集合以及m条数据,所述随机变量集合包括多个随机变量,所述m条数据中每条数据包括所述多个随机变量中至少一个随机变量的取值,m为正整数;计算模块,用于根据所述第一获取模块获取到的m条数据计算第一随机变量与第二随机变量之间的互信息,所述互信息用于指示所述第一随机变量与所述第二随机变量之间的关联程度,所述第一随机变量为所述随机变量集合中任一随机变量,所述第二随机变量为第一变量集合中任一随机变量,所述第一变量集合由所述随机变量集合中除所述第一随机变量以外的其他随机变量组成;第二获取模块,用于从所述第一变量集合中获取互信息最大的K个随机变量,组成所述第一随机变量的候选父节点集合,K为正整数;打分模块,用于获取所述第二获取模块703获取到的候选父节点集合的所有子集,根据所述m条数据,并利用打分函数对所述所有子集中每一个进行评分,每一个子集包括的所有随机变量均为所述第一随机变量的父节点的可能性与所述每一个子集的分数呈负相关;第一删除模块,用于在第一子集的分数大于第二子集的分数时,删除所述第一子集,所述第一子集为所述所有子集中的任一个,所述第二子集为所述所有子集中的一个,且所述第二子集为所述第一子集的子集;第三获取模块,用于获取剩余子集,将所述剩余子集的并集作为所述第一随机变量对应的第二变量集合;添加模块,用于在第三随机变量对应的节点、所述第一随机变量对应的节点之间添加有向边,所述有向边由所述第三本文档来自技高网...
贝叶斯网络构建方法及装置

【技术保护点】
一种贝叶斯网络构建方法,其特征在于,所述方法包括:获取随机变量集合以及m条数据,所述随机变量集合包括多个随机变量,所述m条数据中每条数据包括所述多个随机变量中至少一个随机变量的取值,m为正整数;根据所述m条数据计算第一随机变量与第二随机变量之间的互信息,所述互信息用于指示所述第一随机变量与所述第二随机变量之间的关联程度,所述第一随机变量为所述随机变量集合中任一随机变量,所述第二随机变量为第一变量集合中任一随机变量,所述第一变量集合由所述随机变量集合中除所述第一随机变量以外的其他随机变量组成;从所述第一变量集合中获取互信息最大的K个随机变量,组成所述第一随机变量的候选父节点集合,K为正整数;获取所述候选父节点集合的所有子集,根据所述m条数据,并利用打分函数对所述所有子集中每一个进行评分,每一个子集包括的所有随机变量均为所述第一随机变量的父节点的可能性与所述每一个子集的分数呈负相关;在第一子集的分数大于第二子集的分数时,删除所述第一子集,所述第一子集为所述所有子集中的任一个,所述第二子集为所述所有子集中的一个,且所述第二子集为所述第一子集的子集;获取剩余子集,将所述剩余子集的并集作为所述第一随机变量对应的第二变量集合;在第三随机变量对应的节点、所述第一随机变量对应的节点之间添加有向边,所述有向边由所述第三随机变量对应的节点指向所述第一随机变量对应的节点,所述第三随机变量为所述第二变量集合中任一随机变量。...

【技术特征摘要】
1.一种贝叶斯网络构建方法,其特征在于,所述方法包括:获取随机变量集合以及m条数据,所述随机变量集合包括多个随机变量,所述m条数据中每条数据包括所述多个随机变量中至少一个随机变量的取值,m为正整数;根据所述m条数据计算第一随机变量与第二随机变量之间的互信息,所述互信息用于指示所述第一随机变量与所述第二随机变量之间的关联程度,所述第一随机变量为所述随机变量集合中任一随机变量,所述第二随机变量为第一变量集合中任一随机变量,所述第一变量集合由所述随机变量集合中除所述第一随机变量以外的其他随机变量组成;从所述第一变量集合中获取互信息最大的K个随机变量,组成所述第一随机变量的候选父节点集合,K为正整数;获取所述候选父节点集合的所有子集,根据所述m条数据,并利用打分函数对所述所有子集中每一个进行评分,每一个子集包括的所有随机变量均为所述第一随机变量的父节点的可能性与所述每一个子集的分数呈负相关;在第一子集的分数大于第二子集的分数时,删除所述第一子集,所述第一子集为所述所有子集中的任一个,所述第二子集为所述所有子集中的一个,且所述第二子集为所述第一子集的子集;获取剩余子集,将所述剩余子集的并集作为所述第一随机变量对应的第二变量集合;在第三随机变量对应的节点、所述第一随机变量对应的节点之间添加有向边,所述有向边由所述第三随机变量对应的节点指向所述第一随机变量对应的节点,所述第三随机变量为所述第二变量集合中任一随机变量。2.根据权利要求1所述的方法,其特征在于,所述根据所述m条数据计算第一随机变量与第二随机变量之间的互信息,包括:利用第一公式计算所述第一随机变量与所述第二随机变量之间的互信息,所述第一公式如下:其中,MulInfo(Xi,Xj)为所述第一随机变量与所述第二随机变量之间的互信息,Xi为所述第一随机变量,xi为所述第一随机变量的一个取值,Vi为所述第一随机变量所有可取数值的集合,Xj为所述第二随机变量,xj为所述第二随机变量的一个取值,Vj为第二随机变量所有可取数值的集合,count(xi,xj)为所述m条数据中同时包括xi、xj的数据的数目,count(xi)为所述m条数据中包括xi的数据的数目,count(xj)为所述m条数据中包括xj的数据的数目。3.根据权利要求1所述的方法,其特征在于,所述打分函数如下:其中,Pa为所述所有子集中的一个子集,MDL(Xi,Pa)为Pa的分数,xi为所述第一随机变量的一个取值,Vi为所述第一随机变量所有可取数值的集合,pai为Pa的一个取值组合,所述取值组合包括Pa中每个随机变量的取值,Vpa为Pa的所有可取数值的集合,count(xi,pai)为所述m条数据中同时包括xi、pai的数据的数目,count(xi,pai)为所述m条数据中包括pai的数据的数目,ri为所述第一随机变量的所有可取数值的数目,Xpj为Pa中的一个随机变量,rpj为Xpj的所有可取数值的数目。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:从第一组合中删除包括第三随机变量的子集得到第二组合,所述第一组合包括所述所有子集中剩余的子集;从所述第二组合包括的各个子集的分数中获取最小分数得到第一分数,从所述第一组合包括的各个子集的分数中获取最小分数得到第二分数;将所述第一分数与所述第二分数的差值确定为由所述第三随机变量对应节点指向所述第一随机变量间对应节点的有向边的权重。5.根据权利要求4所述的方法,其特征在于,所述多个随机变量中每个随机变量对应的节点以及节点之间的有向边组成贝叶斯网络,所述方法还包括:获取所述贝叶斯网络中的任一环,获取所述任一环中权重最小的有向边,所述任一环包括的有向边首尾相连;获取所述权重最小的有向边所指向的终止节点,将所有指向所述终止节点的有向边从所述贝叶斯网络中删除,以及获取所述终止节点对应的随机变量得到第四随机变量,从所述第四随机变量对应的第二变量集合中删除所述权重最小的有向边的起始节点对应的随机变量得到更新后的第二变量集合;重新计算所述更新后的第二变量集合中每个随机变量对应的节点指向所述第四随机变量对应的节点的有向边的权重。6.一种贝叶斯网络构建装置,其特征在于,所述装置包括:第一获取模块,用于获取随机变量集合以及m条数据,所述随机变量集合包括多个随机变量,所述m...

【专利技术属性】
技术研发人员:赛影辉张国兴李中兵
申请(专利权)人:奇瑞汽车股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1