System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及云计算,具体为一种分布式云平台故障自愈方法和系统。
技术介绍
1、分布式云场景下,云平台运维更加复杂。基于传统的自动化运维模式,由告警平台提供告警接入和工单推送,运维人员基于告警信息进行故障的响应和处理。由此一来,从故障告警集中接入、分析、工单推送,再到运维人员的响应处理,运维流程长、环节多,系统sla的保障面临着巨大挑战。
2、现有技术中,为了提升分布式云场景下故障响应效率,一个有效的策略是实现自动化运维向智能化运维的转变,由人工响应故障转变为机器响应故障,这就是本专利技术所面临的故障自愈场景;故障自愈的实现机制,通常以告警事件作为驱动,基于机器学习算法识别根因告警,并基于知识库生成故障自愈脚本。根因告警识别的准确性,对于故障自愈来说至关重要。为了减小机器学习算法的误差,必须以人工经验作为辅助,对算法逻辑进行补充和调整。
技术实现思路
1、本专利技术的目的在于提供一种分布式云平台故障自愈方法和系统,以解决上述
技术介绍
中提出的问题。
2、为实现上述目的,本专利技术提供如下技术方案:一种分布式云平台故障自愈方法,所述方法包括如下步骤:
3、告警事件接入;
4、根因告警识别;
5、故障自愈方案生成;
6、脚本下发。
7、优选的,告警事件接入的具体操作包括:
8、各分布式云平台的告警组件基于监控、日志数据实现告警触发,并基于sd-wan网络将告警消息推送到中心侧告警接入组件。
...【技术保护点】
1.一种分布式云平台故障自愈方法,其特征在于:所述方法包括如下步骤:
2.根据权利要求1所述的一种分布式云平台故障自愈方法,其特征在于:告警事件接入的具体操作包括:
3.根据权利要求1所述的一种分布式云平台故障自愈方法,其特征在于:根因告警识别的具体操作包括:
4.根据权利要求1所述的一种分布式云平台故障自愈方法,其特征在于:故障自愈方案生成的具体操作包括:
5.根据权利要求1所述的一种分布式云平台故障自愈方法,其特征在于:脚本下发的具体操作包括:
6.一种根据权利要求1-5任意一项所述分布式云平台故障自愈方法的分布式云平台故障自愈系统,其特征在于:包括告警事件接入、根因告警识别、自愈脚本生成、故障自愈脚本下发、自愈调度执行、运维编排工具六大模块;
7.根据权利要求6所述的一种分布式云平台故障自愈系统,其特征在于:告警特征信息包括:告警云平台编码、告警名称、告警组件、严重级别、开
【技术特征摘要】
1.一种分布式云平台故障自愈方法,其特征在于:所述方法包括如下步骤:
2.根据权利要求1所述的一种分布式云平台故障自愈方法,其特征在于:告警事件接入的具体操作包括:
3.根据权利要求1所述的一种分布式云平台故障自愈方法,其特征在于:根因告警识别的具体操作包括:
4.根据权利要求1所述的一种分布式云平台故障自愈方法,其特征在于:故障自愈方案生成的具体操作包括:
5.根据权利要求1所述...
【专利技术属性】
技术研发人员:吴东生,陈尧,张目飞,
申请(专利权)人:浪潮云信息技术股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。