【技术实现步骤摘要】
监测系统的故障寻因方法、装置、设备及存储介质
[0001]本申请涉及人工智能
,尤其涉及一种监测系统的故障寻因方法、装置、设备及存储介质。
技术介绍
[0002]目前,网络云的规模不断扩大,这对相应监测系统的运行可靠性提出了更高的要求。当监测系统出现故障时,对故障及时且准确的诊断,是衡量系统运维能力的因素之一。
[0003]当监测系统出现故障时,获取时序指标,并对时序指标的全部维度进行遍历搜索根因,且当计算维度较大时,基于欧式距离确定元素的根因潜在得分十分耗时,大量的计算任务降低了根因的搜索速度,且在搜索根因时依赖人工进行调参,对人员的调参经验高度依赖,根因搜索结果的准确度不高,即,现有技术中存在,对监测系统进行故障寻因的效率不高的问题。
[0004]上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
[0005]本专利技术的主要目的在于提供一种监测系统的故障寻因方法、装置、设备及存储介质,旨在解决现有技术中,对监测系统进行故障寻因的效率不高的问题。
[0006]为实现上述目的,本申请提供一种监测系统的故障寻因方法,所述方法包括:
[0007]在检测到监测系统的总故障指标异常时,获取预设的叶子元素的当前值,其中,所述叶子元素和非叶子元素共同组成候选根因元素的数据立方体,所述数据立方体为多层;
[0008]基于所述当前值,计算所述叶子元素的偏差度,得到偏差度集合;
[0009]按照所述数据立方体中所述候选根因元素的 ...
【技术保护点】
【技术特征摘要】
1.一种监测系统的故障寻因方法,其特征在于,所述方法包括:在检测到监测系统的总故障指标异常时,获取预设的叶子元素的当前值,其中,所述叶子元素和非叶子元素共同组成候选根因元素的数据立方体,所述数据立方体为多层;基于所述当前值,计算所述叶子元素的偏差度,得到偏差度集合;按照所述数据立方体中所述候选根因元素的聚合程度由低到高的顺序,基于所述偏差度集合,计算得到每层候选根因元素对应的根因潜在得分;基于所述根因潜在得分,筛选所述候选根因元素,将筛选得到的根因元素加入至根因集合,并从所述数据立方体中删除所述根因元素的后代叶子元素;判断所述根因集合是否符合预设的集合条件,若是,则将当前的根因集合作为所述监测系统的故障根因。2.根据权利要求1所述的监测系统的故障寻因方法,其特征在于,所述基于所述偏差度集合,计算得到每层候选根因元素对应的根因潜在得分的步骤,包括:基于所述偏差度集合,确定分区阈值;基于所述分区阈值,对所述叶子元素分区,得到正常叶子区与异常叶子区;基于所述分区阈值与所述偏差度,确定所述正常叶子区中每个叶子元素的第一权重,以及确定所述异常叶子区中每个叶子元素的第二权重;基于所述第一权重与所述第二权重,计算得到每层候选根因元素对应的根因潜在得分。3.根据权利要求2所述的监测系统的故障寻因方法,其特征在于,所述基于所述第一权重与所述第二权重,计算得到每层候选根因元素对应的根因潜在得分的步骤,包括:基于所述第一权重与所述第二权重,计算得到第一根因潜在得分;基于后代叶子元素的当前值,以及后代叶子元素的预测值,计算得到第二根因潜在得分,其中,所述后代叶子元素的预测值与所述候选根因元素的预测值对应成比例;基于所述第一根因潜在得分与所述第二根因潜在得分,计算得到所述根因潜在得分,其中,当所述候选根因元素为所述叶子元素时,所述第二根因潜在得分为0。4.根据权利要求2所述的监测系统的故障寻因方法,其特征在于,所述基于所述偏差度集合,确定分区阈值的步骤,包括:确定所述偏差度集合的分布情况,其中,所述分布情况包括期望值;基于所述分布情况,从所述偏差度中剔除第一数量的极大值,以及剔除第二数量的极小值,其中,剔除后的偏差度的分布情况包括左端点与右端点;基于所述期望值在所述左端点与所述右端点之间的偏离情况,确定所述分区阈值;其中,所述左端点的值与所述期望值的绝对值为第一绝对值,所述右端点的值与所述期望值的绝对值为第二绝对值,若所述第一绝对值小于所述第二绝对值,则所述期望值为所述左端点的值与所述分区阈值的平均值,若所述第一绝对值大于所述第二绝对值,则所述期望值为所述右端点的值与所述分区阈值的平均值。5.根据权利要求1所述的监测系统的故障寻因方法,其特征在于,所述基于所述当前值,计算所述叶子元素的偏差度,得到偏差度集...
【专利技术属性】
技术研发人员:林之怡,刘聪,赵宇翔,穆铁马,陈澜涛,
申请(专利权)人:中国移动浙江创新研究院有限公司中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。