【技术实现步骤摘要】
本专利技术涉及监控运维,特别涉及一种云平台的告警根因定位和修复方法、装置及设备。
技术介绍
1、随着云计算、微服务架构和容器化技术的普及,现代it(informationtechnology,信息技术)系统的复杂性和动态性呈指数级增长。传统的运维手段,如基于静态阈值的告警、人工规则关联等方法已难以应对以下挑战:单点故障常引发连锁反应,产生海量冗余告警,淹没关键信号,导致运维团队响应延迟;告警信息孤立,缺乏对基础设施、应用拓扑、业务依赖等上下文的关联,使根因定位依赖专家经验;传统运维模式缺乏预测性分析和自动化自愈能力,导致业务中断时间较长。
2、当前迫切需要从传统运维向智能运维(artificial intelligence for itoperations,aiops)的转变。当前已存在几类主流方案,但仍存在局限性:(1)基于规则的告警关联系统:依赖预先编写的规则,逻辑清晰但规则僵化、维护成本高,无法适应云环境的动态变化,且无法处理未预见过的故障模式;(2)基于统计和机器学习的异常检测系统:通过分析指标时间序列检测异常,能发
...【技术保护点】
1.一种云平台的告警根因定位和修复方法,其特征在于,包括:
2.根据权利要求1所述的云平台的告警根因定位和修复方法,其特征在于,所述知识图谱的构建过程,包括:
3.根据权利要求2所述的云平台的告警根因定位和修复方法,其特征在于,所述实体对象包括物理实体、逻辑实体和业务实体;所述实体关系包括从目标配置信息中获取到的显示依赖关系和基于数据分析方法得到的隐式依赖关系。
4.根据权利要求1所述的云平台的告警根因定位和修复方法,其特征在于,所述基于所述知识图谱生成每一所述告警节点的上下文信息,包括:
5.根据权利要求4所述的云平台
...【技术特征摘要】
1.一种云平台的告警根因定位和修复方法,其特征在于,包括:
2.根据权利要求1所述的云平台的告警根因定位和修复方法,其特征在于,所述知识图谱的构建过程,包括:
3.根据权利要求2所述的云平台的告警根因定位和修复方法,其特征在于,所述实体对象包括物理实体、逻辑实体和业务实体;所述实体关系包括从目标配置信息中获取到的显示依赖关系和基于数据分析方法得到的隐式依赖关系。
4.根据权利要求1所述的云平台的告警根因定位和修复方法,其特征在于,所述基于所述知识图谱生成每一所述告警节点的上下文信息,包括:
5.根据权利要求4所述的云平台的告警根因定位和修复方法,其特征在于,所述在所述知识图谱中执行图遍历操作,以获取与所述中心节点满足预设关系的目标信息,包括:
6.根据权利要求1所述的云平台的告警根因定位和修复方法,其特征在于,所述基于所述上下文信息对各所述原始告警信息进行降噪处理以消除无效告警信息,包括:
7.根据权利要求6所述的云平台的告警根因定位和修复方法,其特征在于,所述对各所述原始告警信息中的重复告警信息和相似告警信息进行聚合,包括:
8.根据权利要求6所述的云平台的告警根因定位和修复方法,其特征在于,所述若各所述原始告警信息中存在预设标业务场景下的场景告警信息,则对所述场景告警信息进行抑制,包括:
9.根据权利要求1所述的云平台的告警根因定位和修复方法,其特征在于,所述针对每一所述目标告警信息,从所述知识图谱中确定对应的候选子图,包括:
10.根据权利要求1所述的云平台的告警根因定位和修复方法,其特征在于,所述对所述候选子图中...
【专利技术属性】
技术研发人员:郭涛,郭立民,
申请(专利权)人:济南浪潮数据技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。