贝叶斯网络确定方法、装置、存储介质和电子设备制造方法及图纸

技术编号:20362699 阅读:19 留言:0更新日期:2019-02-16 16:27
本公开涉及一种贝叶斯网络确定方法、装置、存储介质和电子设备,该方法包括:将采集到的预设时间段内的系统指标数据封装为第一数据流;根据第一数据流的投影方差和投影余弦,获取第一数据流的第一判别向量;在历史数据流的判别向量中确定与第一判别向量距离最近的第二判别向量;根据第一判别向量距离和第二判别向量确定第一数据流是否发生概念漂移;当确定第一数据流未发生概念漂移时,将第二判别向量对应的数据流所对应的贝叶斯网络,作为第一数据流对应的贝叶斯网络;当确定第一数据流发生概念漂移时,通过对第一数据流进行贝叶斯网络学习,获取第一数据流对应的贝叶斯网络。能够降低运维过程中的计算复杂度以及降低系统资源消耗。

【技术实现步骤摘要】
贝叶斯网络确定方法、装置、存储介质和电子设备
本公开涉及运维
,具体地,涉及一种贝叶斯网络确定方法、装置、存储介质和电子设备。
技术介绍
CPU(CentralProcessingUnit,中央处理器)资源、内存资源、磁盘IO(Input/Output)资源、网络IO资源等资源是重要的计算机系统资源,是保证系统中各应用正常运行的基础。在实际生产环境中,经常会遇到一些问题(例如,代码质量问题或者程序算法本身问题导致的内存泄漏、CPU计算密集等),因此某些应用的运行问题,可能会急剧增加对系统资源的消耗,使得其中一种或者几种计算机资源耗尽,导致系统中其他正在运行的应用获得不到所需要的系统资源,从而影响其他应用的正常运行,甚至可能导致宕机。在系统运行发生异常时,运维人员通常需要根据经验进行繁琐的操作,以对问题进行查找。为了辅助运维人员更快的找到问题,目前可以通过系统指标数据构建贝叶斯网络,应用贝叶斯网络推理,可以辅助运维人员缩小问题范围,达到快速定位问题的目的。通常,贝叶斯网络推理分两个过程:首先,基于历史数据构建贝叶斯网络(可以称为贝叶斯网络学习),其次,基于贝叶斯网络结构进行推理(可以称为贝叶斯网络推理)。目前,贝叶斯网络推理在实践中的应用已经非常灵活和广泛,但是由于贝叶斯网络结构的复杂性,在构建贝叶斯网络过程中,目前所采用基于评价的搜索打分算法计算复杂度极高,消耗较多的系统资源。
技术实现思路
本公开提供一种贝叶斯网络确定方法、装置、存储介质和电子设备,用于解决目前由于构建贝叶斯网络过程中算法复杂度高造成的消耗系统资源多的问题。为了实现上述目的,本公开的第一方面,提供一种贝叶斯网络确定方法,所述方法包括:将采集到的预设时间段内的系统指标数据封装为第一数据流;根据所述第一数据流的投影方差和投影余弦,获取所述第一数据流的第一判别向量;在历史数据流的判别向量中确定与所述第一判别向量距离最近的第二判别向量,所述历史数据流为在所述第一数据流之前的数据流;根据所述第一判别向量距离和所述第二判别向量确定所述第一数据流是否发生概念漂移;当确定所述第一数据流未发生概念漂移时,将所述第二判别向量对应的数据流所对应的贝叶斯网络,作为所述第一数据流对应的贝叶斯网络;当确定所述第一数据流发生概念漂移时,通过对所述第一数据流进行贝叶斯网络学习,获取所述第一数据流对应的贝叶斯网络。可选地,所述根据所述第一数据流的投影方差和投影余弦,获取所述第一数据流的第一判别向量,包括:根据所述第一数据流的样本集合,获取所述第一数据的样本中心,所述样本集合中包括多个数据样本;根据所述第一数据流的投影矩阵,以及所述样本中心,获取所述第一数据的投影后的样本中心;根据所述投影矩阵,以及所述第一数据流的样本集合,获取所述第一数据流的投影后的样本集合;根据所述投影后的样本集合、所述投影后的样本中心,以及所述第一数据流的样本集合大小,确定所述投影方差;根据所述第一数据流的样本集合,所述投影后的样本集合、所述投影后的样本中心,以及所述第一数据流的样本集合大小,确定所述投影余弦;根据所述投影方差和所述投影余弦获取所述第一判别向量。可选地,所述根据所述第一判别向量距离和所述第二判别向量确定所述第一数据流是否发生概念漂移,包括:获取所述第一判别向量与所述第二判别向量相减所得向量差的范数;判断所述范数是否大于预设阈值;当所述范数大于所述预设阈值时,确定所述第一数据流发生概念漂移;当所述范数小于或等于所述预设阈值时,确定所述第一数据流未发生概念漂移。可选地,所述通过对所述第一数据流进行贝叶斯网络学习,获取所述第一数据流对应的贝叶斯网络,包括:根据所述第一数据流的样本集合中的多个数据样本以及多个变量,生成所述第一数据流的贝叶斯网络集合,所述贝叶斯网络集合中包括:由所述多个变量中的部分变量或全部变量所构成的多个贝叶斯网络;利用预设算法在所述多个贝叶斯网络中确定具有最大后验概率的目标贝叶斯网络,作为所述第一数据流对应的贝叶斯网络。可选地,所述利用预设算法在所述多个贝叶斯网络中确定具有最大后验概率的目标贝叶斯网络,包括:利用贝叶斯狄里克雷打分函数分别获取所述多个贝叶斯网络的后验概率;根据所述多个贝叶斯网络的后验概率,确定所述具有最大后验概率的目标贝叶斯网络。本公开的第二方面,提供一种贝叶斯网络确定装置,所述装置包括:数据采集模块,用于将采集到的预设时间段内的系统指标数据封装为第一数据流;向量获取模块,用于根据所述第一数据流的投影方差和投影余弦,获取所述第一数据流的第一判别向量;向量确定模块,用于在历史数据流的判别向量中确定与所述第一判别向量距离最近的第二判别向量,所述历史数据流为在所述第一数据流之前的数据流;漂移识别模块,用于根据所述第一判别向量距离和所述第二判别向量确定所述第一数据流是否发生概念漂移;网络确定模块,用于当确定所述第一数据流未发生概念漂移时,将所述第二判别向量对应的数据流所对应的贝叶斯网络,作为所述第一数据流对应的贝叶斯网络;网络获取模块,用于当确定所述第一数据流发生概念漂移时,通过对所述第一数据流进行贝叶斯网络学习,获取所述第一数据流对应的贝叶斯网络。可选地,所述向量获取模块,包括:样本中心获取子模块,用于根据所述第一数据流的样本集合,获取所述第一数据的样本中心,所述样本集合中包括多个数据样本;样本中心投影子模块,用于根据所述第一数据流的投影矩阵,以及所述样本中心,获取所述第一数据的投影后的样本中心;样本集合投影子模块,用于根据所述投影矩阵,以及所述第一数据流的样本集合,获取所述第一数据流的投影后的样本集合;投影方差获取子模块,用于根据所述投影后的样本集合、所述投影后的样本中心,以及所述第一数据流的样本集合大小,确定所述投影方差;投影余弦获取子模块,用于根据所述第一数据流的样本集合,所述投影后的样本集合、所述投影后的样本中心,以及所述第一数据流的样本集合大小,确定所述投影余弦;向量获取子模块,用于根据所述投影方差和所述投影余弦获取所述第一判别向量。可选地,所述漂移识别模块,包括:计算子模块,用于获取所述第一判别向量与所述第二判别向量相减所得向量差的范数;判断子模块,用于判断所述范数是否大于预设阈值;确定子模块,用于当所述范数大于所述预设阈值时,确定所述第一数据流发生概念漂移;当所述范数小于或等于所述预设阈值时,确定所述第一数据流未发生概念漂移。可选地,所述网络获取模块,包括:概率计算子模块,用于根据所述第一数据流的样本集合中的多个数据样本以及多个变量,生成所述第一数据流的贝叶斯网络集合,所述贝叶斯网络集合中包括:由所述多个变量中的部分变量或全部变量所构成的多个贝叶斯网络;网络选择子模块,用于利用预设算法在所述多个贝叶斯网络中确定具有最大后验概率的目标贝叶斯网络,作为所述第一数据流对应的贝叶斯网络。可选地,所述网络选择子模块,用于:利用贝叶斯狄里克雷打分函数分别获取所述多个贝叶斯网络的后验概率;根据所述多个贝叶斯网络的后验概率,确定所述具有最大后验概率的目标贝叶斯网络。本公开的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述方法的步骤。本公开的第四方面,提供一种电子设备,包括:存储器,其上存储本文档来自技高网...

【技术保护点】
1.一种贝叶斯网络确定方法,其特征在于,所述方法包括:将采集到的预设时间段内的系统指标数据封装为第一数据流;根据所述第一数据流的投影方差和投影余弦,获取所述第一数据流的第一判别向量;在历史数据流的判别向量中确定与所述第一判别向量距离最近的第二判别向量,所述历史数据流为在所述第一数据流之前的数据流;根据所述第一判别向量距离和所述第二判别向量确定所述第一数据流是否发生概念漂移;当确定所述第一数据流未发生概念漂移时,将所述第二判别向量对应的数据流所对应的贝叶斯网络,作为所述第一数据流对应的贝叶斯网络;当确定所述第一数据流发生概念漂移时,通过对所述第一数据流进行贝叶斯网络学习,获取所述第一数据流对应的贝叶斯网络。

【技术特征摘要】
1.一种贝叶斯网络确定方法,其特征在于,所述方法包括:将采集到的预设时间段内的系统指标数据封装为第一数据流;根据所述第一数据流的投影方差和投影余弦,获取所述第一数据流的第一判别向量;在历史数据流的判别向量中确定与所述第一判别向量距离最近的第二判别向量,所述历史数据流为在所述第一数据流之前的数据流;根据所述第一判别向量距离和所述第二判别向量确定所述第一数据流是否发生概念漂移;当确定所述第一数据流未发生概念漂移时,将所述第二判别向量对应的数据流所对应的贝叶斯网络,作为所述第一数据流对应的贝叶斯网络;当确定所述第一数据流发生概念漂移时,通过对所述第一数据流进行贝叶斯网络学习,获取所述第一数据流对应的贝叶斯网络。2.根据权利要求1所述的方法,其特征在于,所述根据所述第一数据流的投影方差和投影余弦,获取所述第一数据流的第一判别向量,包括:根据所述第一数据流的样本集合,获取所述第一数据的样本中心,所述样本集合中包括多个数据样本;根据所述第一数据流的投影矩阵,以及所述样本中心,获取所述第一数据的投影后的样本中心;根据所述投影矩阵,以及所述第一数据流的样本集合,获取所述第一数据流的投影后的样本集合;根据所述投影后的样本集合、所述投影后的样本中心,以及所述第一数据流的样本集合大小,确定所述投影方差;根据所述第一数据流的样本集合,所述投影后的样本集合、所述投影后的样本中心,以及所述第一数据流的样本集合大小,确定所述投影余弦;根据所述投影方差和所述投影余弦获取所述第一判别向量。3.根据权利要求1所述的方法,其特征在于,所述根据所述第一判别向量距离和所述第二判别向量确定所述第一数据流是否发生概念漂移,包括:获取所述第一判别向量与所述第二判别向量相减所得向量差的范数;判断所述范数是否大于预设阈值;当所述范数大于所述预设阈值时,确定所述第一数据流发生概念漂移;当所述范数小于或等于所述预设阈值时,确定所述第一数据流未发生概念漂移。4.根据权利要求1所述的方法,其特征在于,所述通过对所述第一数据流进行贝叶斯网络学习,获取所述第一数据流对应的贝叶斯网络,包括:根据所述第一数据流的样本集合中的多个数据样本以及多个变量,生成所述第一数据流的贝叶斯网络集合,所述贝叶斯网络集合中包括:由所述多个变量中的部分变量或全部变量所构成的多个贝叶斯网络;利用预设算法在所述多个贝叶斯网络中确定具有最大后验概率的目标贝叶斯网络,作为所述第一数据流对应的贝叶斯网络。5.根据权利要求4所述的方法,其特征在于,所述利用预设算法在所述多个贝叶斯网络中确定具有最大后验概率的目标贝叶斯网络,包括:利用贝叶斯狄里克雷打分函数分别...

【专利技术属性】
技术研发人员:吴斌石子凡许力张霞
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1