宿主机故障修复方法及装置、系统、电子设备和存储介质制造方法及图纸

技术编号:41277240 阅读:24 留言:0更新日期:2024-05-11 09:29
本公开公开了宿主机故障修复方法及装置、电子设备和存储介质,在接收到被控节点发送的异常信息后,或在预设发送周期未接收到被控节点发送的心跳包后,根据故障判断规则对被控节点对应的宿主机进行至少一个故障的判定;将至少一个故障的集合确定为目标故障集;从预先配置的故障集与处理方式集之间的映射关系,确定目标故障集对应的目标处理方式;将目标处理方式发送至被控节点,以便被控节点根据目标处理方式对被控节点对应的宿主机进行修复。本公开提供的宿主机故障修复方法,增加了宿主机故障判定的全面性和可配置性,有效提升了宿主机故障判定的准确率,减少漏判,有效提升了宿主机故障判定的灵活性和可扩展性,提升了云计算服务的可用性。

【技术实现步骤摘要】

本公开涉及云计算,尤其涉及一种宿主机故障修复方法及装置、系统、电子设备和存储介质


技术介绍

1、随着云计算技术的迅速发展,越来越多的企业都在积极推动传统业务应用迁移上云,即把原来部署在物理服务器上的业务系统改为部署到云服务器上,因此,云计算服务的可用性在一定程度上决定着客户业务的可用性。云计算服务通常运行在数量众多的物理服务器(即宿主机)上,由于宿主机数量基数大以及云计算本身的复杂性,常常因软硬件的各种故障导致宿主机出现整体或局部性的故障。而宿主机上,通常运行着多个承载客户业务的云主机,宿主机的故障将导致云主机无法正常运行,从而影响云计算服务的可用性。因此,开发出一种检测和修复宿主机故障的方法对于提升云计算服务的可用性十分必要。

2、相关的云计算宿主机故障修复技术,一般通过智能平台管理接口(intelligentplatform management interface,ipmi)协议,采集宿主机电源状态、cpu状态、内存状态和网卡状态的性能数据,并将上述性能数据与预设的性能数据指标进行比较来判断对应的宿主机是否需要进行疏散处理,对故障的判定本文档来自技高网...

【技术保护点】

1.一种宿主机故障修复方法,其特征在于,所述方法应用于控制节点,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据故障判断规则对所述被控节点进行至少一个故障的判定包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述执行步骤及对应的预设判断顺序对所述被控节点对应的宿主机进行至少一个故障的判定包括:

4.根据权利要求3所述的方法,其特征在于,所述预设判断顺序及所述判断逻辑存储于有向无环图对应的配置文件中;

5.根据权利要求4所述的方法,其特征在于,所述根据所述配置文件生成包含所述预设判断顺序及所述判断逻辑的有向无环图还包括:<...

【技术特征摘要】

1.一种宿主机故障修复方法,其特征在于,所述方法应用于控制节点,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据故障判断规则对所述被控节点进行至少一个故障的判定包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述执行步骤及对应的预设判断顺序对所述被控节点对应的宿主机进行至少一个故障的判定包括:

4.根据权利要求3所述的方法,其特征在于,所述预设判断顺序及所述判断逻辑存储于有向无环图对应的配置文件中;

5.根据权利要求4所述的方法,其特征在于,所述根据所述配置文件生成包含所述预设判断...

【专利技术属性】
技术研发人员:肖银秋陆鋆李向瑜
申请(专利权)人:中移苏州软件技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1