【技术实现步骤摘要】
一种故障模式挖掘方法及系统
[0001]本专利技术公开一种故障模式挖掘方法及系统,涉及故障运维
技术介绍
[0002]随着云计算的飞速发展,企业IT应用规模和应用复杂度快速膨胀,运维复杂度显著提高。为了保障业务SLA,监控告警是稳定运行的基石。目前运维人员每天会收到大量的告警通知,告警的泛滥使运维人员被无效告警淹没,分身乏力。
[0003]在故障发生时,往往会伴随一系列的相关告警,如何将故障相关的告警聚合到一起对运维人员快速识别故障、解决故障具有重要意义。在运维领域通常采用频繁项集挖掘算法实现相关告警的识别,但是对于故障模式的挖掘若直接采用频繁项集挖掘算法,往往由于故障发生频率较低,通常不满足置信度条件,无法有效识别故障模式。所以如何利用频繁项集挖掘算法有效识别故障模式是一个值得研究的课题。
技术实现思路
[0004]本专利技术针对现有技术的问题,提供一种故障模式挖掘方法及系统,所采用的技术方案为:一种故障模式挖掘系统,所述系统包括事件源、事件分发单元、消息队列单元、事件统计单元、故障检测单 ...
【技术保护点】
【技术特征摘要】
1.一种故障模式挖掘系统,其特征是所述系统包括事件源、事件分发单元、消息队列单元、事件统计单元、故障检测单元、算法参数配置单元、故障模式挖掘单元、任务调度单元;所述事件分发单元从事件源接收到事件后,会将事件推送到消息队列单元;所述事件统计单元和故障检测单元实时监听消息队列单元的事件消息;所述事件统计单元实时统计不同告警事件按天、按小时的发生次数;所述任务调度单元根据算法参数配置单元设置的故障模式挖掘周期,定时触发故障模式挖掘单元执行故障模式挖掘。2.根据权利要求1所述的系统,其特征是所述算法参数配置单元的配置参数包括,分析时间范围、分析事件次数分位点、熵值分位点、故障模式置信度、故障模式最小事件数、滑动窗口大小、滑动窗口步长、故障模式挖掘周期、故障模式有效期。3.根据权利要求2所述的系统,其特征是所述系统还包括事件熵值计算单元;所述熵值分位点由事件生熵值计算单元计算得出。4.根据权利要求3所述的系统,其特征是所述熵值计算单元计算包括:对于给定告警时间名称,统计算法参数配置单元中分析v时间范围内当前时间发生的天数;统计分析时间范围内当前时间按小时的时间分布,计算事件时间熵值。5.根据权利要求4所述的系统,其特征是所述系统还包括数据库。6.一种故障模式挖掘方法,基于上述权利要求1
‑
5任一所述的故障模式挖掘系统实现,其特征在于,所述故障模式挖掘单元从数据库中查询一段时间范围内的告警事件,时间范围大小等于算法参数配置单元中设置的分析时间范围大小;按照算法参数配置单元中设置的分析事件次数分位点,初步筛选分位点包含的告警事件名称;依次计算...
【专利技术属性】
技术研发人员:孙光涛,陈尧,张永皋,华震,
申请(专利权)人:浪潮云信息技术股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。