集群系统的失效预测方法及装置制造方法及图纸

技术编号:10071557 阅读:152 留言:0更新日期:2014-05-23 17:01
本发明专利技术实施例提供一种集群系统的失效预测方法及装置。方法包括:根据集群系统的失效事件集合对事件序列模式集合进行聚类分析,获得事件序列簇;对事件序列簇进行因果关联分析,获取因果关联路径簇;对因果关联路径簇进行失效分析,获取集群系统的失效模式;根据失效模式,对集群系统进行失效预测。本发明专利技术实施例提供的集群系统的失效预测方法及装置对事件序列模式集合进行聚类获得因果关联路径簇,从而获得集群系统的失效模式,根据获取的失效模式对集群系统进行失效预测。可以通过对集群系统日志进行深度的分析和挖掘,获得用于失效预测的可靠的失效规则,进而提高失效预测的召回率。

【技术实现步骤摘要】
集群系统的失效预测方法及装置
本专利技术实施例涉及计算机技术,尤其涉及一种集群系统的失效预测方法及装置。
技术介绍
随着集群系统在大规模生产性计算平台中的广泛应用,集群系统的失效和错误也频繁出现,集群系统的失效或错误造成的业务中断、数据泄漏甚至数据丢失往往会带给用户沉重的打击。因此,集群系统的安全性、可靠性以及可用性的重要性也日渐突出。现有技术中,通常会通过对集群系统日志中的失效事件进行简单的统计以得到失效事件序列关联规则(简称失效规则),再根据失效规则对集群系统进行失效预测,从而提升集群系统的安全性、可靠性以及可用性。通常可以使用预测召回率这一指标来评价失效预测结果的有效性,预测召回率用于表示预测正确的失效事件数在需要被预测的所有失效事件中所占的比例。但由于集群系统日志中记录了许多冗余事件,例如无征兆情况下发生的失效事件或者出现次数较少的失效事件,导致据此统计获得的失效规则可靠性较低。所以现有技术中失效预测方法的预测召回率尚待提高。
技术实现思路
本专利技术实施例提供一种集群系统的失效预测方法及装置。第一方面,本专利技术实施例提供的集群系统的失效预测方法包括:根据集群系统的失效事件集合对事件序列模式集合进行聚类分析,获得事件序列簇;对所述事件序列簇进行因果关联分析,获取因果关联路径簇;对所述因果关联路径簇进行失效分析,获取所述集群系统的失效模式;根据所述失效模式,对所述集群系统进行失效预测。在第一方面的第一种可能的实现方式中,所述根据集群系统的失效事件集合对事件序列模式集合进行聚类分析之前,还包括:从所述集群系统的日志事件库中获取所述失效事件集合和所述事件序列模式集合。根据第一方面或第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述根据集群系统的失效事件集合对事件序列模式集合进行聚类分析,获得事件序列簇,包括:在所述事件序列模式集合中查找包含第一失效事件的第一事件序列模式,所述第一失效事件属于所述失效事件集合;将所述第一事件序列模式和所述第一事件序列模式的第一支持度计数添加至所述事件序列簇。根据第一方面或第一方面的前两种可能的实现方式,在第三种可能的实现方式中,所述根据所述事件序列簇,获取因果关联路径簇,包括:根据所述事件序列簇构建因果关系网;根据所述因果关系网获取所述因果关联路径簇。根据第一方面或第一方面的前三种可能的实现方式,在第四种可能的实现方式中,所述对所述因果关联路径簇进行失效分析,获取所述集群系统的失效模式,包括:以所述因果关联路径簇中包含的第二失效事件为后件,以所述因果关联路径簇中包含的处于所述第二失效事件前一位置的事件为前件,将所述前件与所述后件构造为二元失效因果路径簇;根据事件类型表,查找所述前件与所述后件分别对应的前件事件类型标识与后件事件类型标识,将所述二元失效因果路径簇中包含的所述前件与所述后件分别替换为所述前件事件类型标识与所述后件事件类型标识,得到由所述前件事件类型标识与所述后件事件类型标识构成的所述失效模式。根据第一方面或第一方面的前四种可能的实现方式,在第五种可能的实现方式中,所述根据所述失效模式,对所述集群系统进行失效预测,包括:根据所述失效模式,对失效事件序列关联规则库进行更新;采用更新后的失效事件序列关联规则库,对所述集群系统进行失效预测。根据第五种可能的实现方式,在第六种可能的实现方式中,根据所述失效模式,对失效事件序列关联规则库进行更新,包括:根据所述失效模式,获取第二事件序列模式;将所述第二事件序列模式对应的失效事件序列关联规则添加至所述失效事件序列关联规则库。根据第五种或者第六种可能的实现方式,在第七种可能的实现方式中,所述采用更新后的失效事件序列关联规则库,对所述集群系统进行失效预测,包括:在预测有效窗口内,采用更新后的失效事件序列关联规则库,对所述集群系统进行失效预测。第二方面,本专利技术实施例提供的集群系统的失效预测装置包括事件序列簇获取模块,用于根据集群系统的失效事件集合对事件序列模式集合进行聚类分析,获得事件序列簇;因果关联路径簇获取模块,用于对所述事件序列簇进行因果关联分析,获取因果关联路径簇;失效模式获取模块,用于对所述因果关联路径簇进行失效分析,获取所述集群系统的失效模式;失效预测模块,用于根据所述失效模式,对所述集群系统进行失效预测。在第二方面的第一种可能的实现方式中,还包括:事件获取模块,用于从所述集群系统的日志事件库中获取所述失效事件集合和所述事件序列模式集合。根据第二方面或第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述事件序列簇获取模块具体用于:在所述事件序列模式集合中查找包含第一失效事件的第一事件序列模式,所述第一失效事件属于所述失效事件集合;将所述第一事件序列模式和所述第一事件序列模式的第一支持度计数添加至所述事件序列簇。根据第二方面或第二方面的前两种可能的实现方式,在第三种可能的实现方式中,所述因果关联路径簇获取模块具体用于:根据所述事件序列簇构建因果关系网;根据所述因果关系网获取所述因果关联路径簇。根据第二方面或第二方面的前三种可能的实现方式,在第四种可能的实现方式中,所述失效模式获取模块具体用于:以所述因果关联路径簇中包含的第二失效事件为后件,以所述因果关联路径簇中包含的处于所述第二失效事件前一位置的事件为前件,将所述前件与所述后件构造为二元失效因果路径簇;根据事件类型表,查找所述前件与所述后件分别对应的前件事件类型标识与后件事件类型标识,将所述二元失效因果路径簇中包含的所述前件与所述后件分别替换为所述前件事件类型标识与所述后件事件类型标识,得到由所述前件事件类型标识与所述后件事件类型标识构成的所述失效模式。根据第二方面或第二方面的前四种可能的实现方式,在第五种可能的实现方式中,所述失效预测模块具体用于:根据所述失效模式,对失效事件序列关联规则库进行更新;采用更新后的失效事件序列关联规则库,对所述集群系统进行失效预测。根据第五种可能的实现方式,在第六种可能的实现方式中,所述失效预测模块具体还用于:根据所述失效模式,获取第二事件序列模式;将所述第二事件序列模式对应的失效事件序列关联规则添加至所述失效事件序列关联规则库。根据第五种或者第六种可能的实现方式,在第七种可能的实现方式中,所述失效预测模块还用于:在预测有效窗口内,采用更新后的失效事件序列关联规则库,对所述集群系统进行失效预测。本专利技术实施例提供的集群系统的失效预测方法及装置,对事件序列模式集合进行聚类获得因果关联路径簇,从而获得集群系统的失效模式,根据获取的失效模式对集群系统进行失效预测。可以通过对集群系统日志进行深度的分析和挖掘,获得用于失效预测的可靠的失效规则,进而提高失效预测的召回率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的集群系统的失效预测方法一实施例的流程图;图2为本专利技术提供的集群系统的失效预测方法中获得事件序列簇的方法实施例流程图;图3A为本专利技术提供的集群系统的失效预测方法中获取因果关联路径簇的方本文档来自技高网...
集群系统的失效预测方法及装置

【技术保护点】
一种集群系统的失效预测方法,其特征在于,包括:根据集群系统的失效事件集合对事件序列模式集合进行聚类分析,获得事件序列簇;对所述事件序列簇进行因果关联分析,获取因果关联路径簇;对所述因果关联路径簇进行失效分析,获取所述集群系统的失效模式;根据所述失效模式,对所述集群系统进行失效预测。

【技术特征摘要】
1.一种集群系统的失效预测方法,其特征在于,包括:根据集群系统的失效事件集合对事件序列模式集合进行聚类分析,获得事件序列簇;对所述事件序列簇进行因果关联分析,获取因果关联路径簇;对所述因果关联路径簇进行失效分析,获取所述集群系统的失效模式;根据所述失效模式,对所述集群系统进行失效预测;其中,所述对所述因果关联路径簇进行失效分析,获取所述集群系统的失效模式,包括:以所述因果关联路径簇中包含的第二失效事件为后件,以所述因果关联路径簇中包含的处于所述第二失效事件前一位置的事件为前件,将所述前件与所述后件构造为二元失效因果路径簇;根据事件类型表,查找所述前件与所述后件分别对应的前件事件类型标识与后件事件类型标识,将所述二元失效因果路径簇中包含的所述前件与所述后件分别替换为所述前件事件类型标识与所述后件事件类型标识,得到由所述前件事件类型标识与所述后件事件类型标识构成的所述失效模式。2.根据权利要求1所述的方法,其特征在于,所述根据集群系统的失效事件集合对事件序列模式集合进行聚类分析之前,还包括:从所述集群系统的日志事件库中获取所述失效事件集合和所述事件序列模式集合。3.根据权利要求1或2所述的方法,其特征在于,所述根据集群系统的失效事件集合对事件序列模式集合进行聚类分析,获得事件序列簇,包括:在所述事件序列模式集合中查找包含第一失效事件的第一事件序列模式,所述第一失效事件属于所述失效事件集合;确定所述事件序列簇包括所述第一事件序列模式和所述第一事件序列模式的第一支持度计数。4.根据权利要求1~3中任一项所述的方法,其特征在于,所述对所述事件序列簇进行因果分析,获取因果关联路径簇,包括:根据所述事件序列簇构建因果关系网;根据所述因果关系网获取所述因果关联路径簇。5.根据权利要求1~4中任一项所述的方法,其特征在于,所述根据所述失效模式,对所述集群系统进行失效预测,包括:根据所述失效模式,对失效事件序列关联规则库进行更新;采用更新后的失效事件序列关联规则库,对所述集群系统进行失效预测。6.根据权利要求5所述的方法,其特征在于,根据所述失效模式,对失效事件序列关联规则库进行更新,包括:根据所述失效模式,获取第二事件序列模式;将所述第二事件序列模式对应的失效事件序列关联规则添加至所述失效事件序列关联规则库。7.根据权利要求5或6所述的方法,其特征在于,所述采用更新后的失效事件序列关联规则库,对所述集群系统进行失效预测,包括...

【专利技术属性】
技术研发人员:付晓毓任睿詹剑锋
申请(专利权)人:华为技术有限公司中国科学院计算技术研究所
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1