System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 故障处理方法、装置、电子设备及存储介质制造方法及图纸_技高网

故障处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40555385 阅读:10 留言:0更新日期:2024-03-05 19:16
本发明专利技术提供一种故障处理方法、装置、电子设备及存储介质,方法包括:获取第一资源配置信息,第一资源配置信息表征服务处于预设状态;获取第二资源配置信息,第二资源配置信息表征服务处于故障处理后的状态;判断第二资源配置信息与第一资源配置信息是否相同,在第二资源配置信息与第一资源配置信息不相同时,修正第二资源配置信息以使服务处于预设状态。服务从预设状态经过一系列的故障处理措施后,又再次回到预设状态,实现了服务状态的最终一致性,形成故障处理的一个完整的闭环。

【技术实现步骤摘要】

本专利技术涉及运维,尤其涉及故障处理方法、装置、电子设备及存储介质


技术介绍

1、不管是现在的云,还是云原生,亦或者未来的ai智能,都是为用户服务,而服务脱离不了的一个特性,稳定。服务的稳定是服务面向用户的基本保障,在服务稳定的背后则是无数个大大小小的运维操作。这些运维操作包括自动触发型操作、人工触发型操作、人工手工操作等。这些操作的对象通常是服务的一些配置、服务的部署架构、服务的宿主机等,用来在短时间内规避发现的风险,降低使用服务的用户的感知。通用的方案有主备切换、降级、调整策略、扩缩容等,这些方案的本质是把服务故障状态切换到非故障的状态,如果假定在故障之前服务的状态a,那么执行了方案之后的服务状态则为b。整个运维操作流程则为a状态->故障状态->b状态,这也是当前的主流运维方案。

2、当前的主流运维方案在解决问题的同时,也把服务从a状态变更成了b状态,而b状态通常是临时状态。由于很多故障问题并不是很快能够解决,有时候持续几个小时,甚至持续数周。在服务的维护工作中,运维人员的重点通常是放在故障的维修过程中,而对于应对过故障的状态b,人们会很少去关注它,因此b状态可能也会随之持续下去,慢慢的,也就没有程序或运维人员记得服务的最初状态,而我们的服务也不可能只有一次运维操作,后面也会有无数个状态,状态c、状态d、状态e等,不管是后续的哪个状态,对比最初设计的状态a,都会存在一些差异,这些差异会给服务带来稳定性的风险。


技术实现思路

1、有鉴于此,本专利技术实施例提供了一种故障处理方法、装置、电子设备及存储介质,以提高服务的稳定性。

2、根据本专利技术的一方面,提供了一种故障处理方法,包括:

3、获取第一资源配置信息,所述第一资源配置信息表征服务处于预设状态;

4、获取第二资源配置信息,所述第二资源配置信息表征服务处于故障处理后的状态;

5、判断所述第二资源配置信息与所述第一资源配置信息是否相同,在所述第二资源配置信息与所述第一资源配置信息不相同时,修正所述第二资源配置信息以使所述服务处于所述预设状态。

6、优选地,所述第一资源配置信息基于服务的sla设定。

7、优选地,所述判断所述第二资源配置信息与所述第一资源配置信息是否相同包括:

8、按照第一预设时间间隔周期性地判断所述第二资源配置信息与所述第一资源配置信息是否相同;

9、所述第一预设时间间隔基于服务的sla设定。

10、优选地,所述在所述第二资源配置信息与所述第一资源配置信息不相同时,修正所述第二资源配置信息以使所述服务处于所述预设状态,包括:

11、在所述第二资源配置信息与所述第一资源配置信息不相同时,按照第二预设时间间隔周期性地检测所述服务是否处于故障状态;所述第二预设时间间隔基于服务的sla设定;

12、在所述服务不处于故障状态时,修正所述第二资源配置信息以使所述服务处于所述预设状态。

13、优选地,所述在所述服务不处于故障状态时,修正所述第二资源配置信息以使所述服务处于所述预设状态,包括:

14、在所述服务不处于故障状态时,制定修正指标;

15、判断所述修正指标是否影响用户使用;若否,修正所述第二资源配置信息以使所述服务处于所述预设状态。

16、优选地,还包括:若所述修正指标影响用户使用,生成修正事件并发送至人工处理端口。

17、优选地,还包括:在完成修正后,记录所述修正前的第二资源配置信息及修正的时间。

18、根据本专利技术的另一方面,提供了一种故障闭环处理装置,包括:

19、第一获取模块,用于获取第一资源配置信息,所述第一资源配置信息表征服务处于预设状态;

20、第二获取模块,用于获取第二资源配置信息,所述第二资源配置信息表征服务处于故障处理后的状态;

21、修正模块,用于判断所述第二资源配置信息与所述第一资源配置信息是否相同,在所述第二资源配置信息与所述第一资源配置信息不相同时,修正所述第二资源配置信息以使所述服务处于所述预设状态。

22、根据本专利技术的另一方面,提供了一种电子设备,包括:

23、处理器;以及

24、存储程序的存储器,

25、其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行上述的方法。

26、根据本专利技术的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使计算机执行上述的方法。

27、本申请实施例中提供的故障处理方法、装置、电子设备及存储介质,服务从预设状态经过一系列的故障处理措施后,又再次回到预设状态,实现了服务状态的最终一致性,形成故障处理的一个完整的闭环。无论经过多少次的维护操作,服务都能修正回预设状态,避免因为一个故障处理引入另外一个故障隐患。

本文档来自技高网...

【技术保护点】

1.一种故障处理方法,其特征在于,包括:

2.根据权利要求1所述的故障处理方法,其特征在于,所述第一资源配置信息基于服务的SLA设定。

3.根据权利要求2所述的故障处理方法,其特征在于,所述判断所述第二资源配置信息与所述第一资源配置信息是否相同包括:

4.根据权利要求2所述的故障处理方法,其特征在于,所述在所述第二资源配置信息与所述第一资源配置信息不相同时,修正所述第二资源配置信息以使所述服务处于所述预设状态,包括:

5.根据权利要求4所述的故障处理方法,其特征在于,所述在所述服务不处于故障状态时,修正所述第二资源配置信息以使所述服务处于所述预设状态,包括:

6.根据权利要求5所述的故障处理方法,其特征在于,还包括:若所述修正指标影响用户使用,生成修正事件并发送至人工处理端口。

7.根据权利要求1至6中任一项所述的故障处理方法,其特征在于,还包括:在完成修正后,记录所述修正前的第二资源配置信息及修正的时间。

8.一种故障闭环处理装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,其中,所述计算机指令用于使计算机执行根据权利要求1-7中任一项所述的方法。

...

【技术特征摘要】

1.一种故障处理方法,其特征在于,包括:

2.根据权利要求1所述的故障处理方法,其特征在于,所述第一资源配置信息基于服务的sla设定。

3.根据权利要求2所述的故障处理方法,其特征在于,所述判断所述第二资源配置信息与所述第一资源配置信息是否相同包括:

4.根据权利要求2所述的故障处理方法,其特征在于,所述在所述第二资源配置信息与所述第一资源配置信息不相同时,修正所述第二资源配置信息以使所述服务处于所述预设状态,包括:

5.根据权利要求4所述的故障处理方法,其特征在于,所述在所述服务不处于故障状态时,修正所述第二资源配置信息...

【专利技术属性】
技术研发人员:梁鹏飞陈存利
申请(专利权)人:度小满科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1