一种虚拟机故障处理方法、系统及电子设备技术方案

技术编号:37088244 阅读:12 留言:0更新日期:2023-03-29 20:03
本说明书实施例公开了一种虚拟机故障处理方法、系统及电子设备,能够有效解决热备虚拟机组中的脑裂问题。所述方法应用于虚拟化管理平台,所述虚拟化管理平台包括监视器、计算节点与控制节点,所述方法包括:所述监视器在目标虚拟机组出现故障时向所述计算节点发送故障事件消息;所述计算节点从所述故障事件消息中提取所述目标虚拟机组的状态指示信息并转发至所述控制节点;所述控制节点针对所述状态指示信息对所述目标虚拟机组进行仲裁处理。所述系统包括虚拟机监视器、计算节点单元与控制节点单元。所述电子设备中的计算机程序用于实现所述虚拟机故障处理方法。实现所述虚拟机故障处理方法。实现所述虚拟机故障处理方法。

【技术实现步骤摘要】
一种虚拟机故障处理方法、系统及电子设备


[0001]本说明书涉及虚拟机安全
,具体涉及一种虚拟机故障处理方法、系统及电子设备。

技术介绍

[0002]COLO(COarse

grained LOck

stepping)是一种虚拟机的高可用解决方案。在综合虚拟化管理平台中,通过设置FT(fault tolerance)热备虚拟机组实现COLO功能。在启动COLO功能后,FT虚拟机组中的主虚拟机(PVM,primary VM)和备虚拟机(SVM,secondary VM)都会同时处于running状态。主虚拟机PVM和备虚拟机SVM都可以接收到来自客户端Client的网络数据包,并对数据包做出回应。
[0003]在FT虚拟机组中,如果主虚拟机PVM出现故障,会切换到备虚拟机SVM。当备虚拟机故障了,需要重建一个新的备虚拟机从而组建成一组新的FT虚拟机组。但是当虚拟机同步网络出现故障时,其实就有可能出现脑裂的情况出现,主备虚机都认为自己是正常的并各自开始独立工作,这会导致各种异常状况,当FT虚拟机组出现脑裂情况时如何进行仲裁处理使其恢复正常运行是一个亟待解决的问题。

技术实现思路

[0004]有鉴于此,本说明书实施例提供了一种虚拟机故障处理方法、系统及电子设备,以解决FT虚拟机组中主、备虚拟机脑裂的问题。
[0005]在第一方面,本说明书实施例提供了一种虚拟机故障处理方法,所述方法应用于虚拟化管理平台,所述虚拟化管理平台包括监视器、计算节点与控制节点。所述方法包括:
[0006]所述监视器对目标虚拟机组进行监控,以确定所述目标虚拟机组是否出现故障;
[0007]在所述目标虚拟机组出现故障时,所述监视器生成故障事件消息并将所述故障事件消息发送至所述计算节点;
[0008]所述计算节点从所述故障事件消息中提取所述目标虚拟机组的状态指示信息并转发至所述控制节点;所述状态指示信息包括备机故障指示、主备切换指示以及关机指示;
[0009]所述控制节点针对所述状态指示信息对所述目标虚拟机组进行仲裁处理。
[0010]可选的,在所述状态指示信息为所述备机故障状态时,所述控制节点针对所述状态指示信息对所述目标虚拟机组进行仲裁处理,包括:
[0011]确定所述目标虚拟机组中主虚拟机的存储状态是否正常;
[0012]响应于所述主虚拟机的存储状态正常,强制关闭所述目标虚拟机组中的备虚拟机;
[0013]响应于所述主虚拟机的存储状态异常,确定所述备虚拟机的存储状态是否正常;
[0014]响应于所述备虚拟机的存储状态异常,强制关闭所述备虚拟机;
[0015]响应于所述备虚拟机的存储状态正常,确定所述备虚拟机的运行状态是否正常;
[0016]响应于所述备虚拟机的运行状态异常,强制关闭所述备虚拟机;
[0017]响应于所述备虚拟机的运行状态正常,将所述备虚拟机切换为主虚拟机。
[0018]可选的,在所述状态指示信息为所述主备切换状态时,所述控制节点针对所述状态指示信息对所述目标虚拟机组进行仲裁处理,包括:
[0019]确定所述目标虚拟机组中主虚拟机是否正在被删除;
[0020]响应于所述主虚拟机正在被删除,终止删除操作并生成示警信息;
[0021]响应于所述主虚拟机未被删除,确定所述主虚拟机的运行状态并确定所述主虚拟机是否接收到所述备机故障指示;
[0022]响应于所述主虚拟机满足运行状态异常且未接收到所述备机故障指示,确定所述主虚拟机是否接收到所述关机指示并关机;
[0023]响应于所述主虚拟机不满足接收到所述关机指示并关机,将所述目标虚拟机组中的备虚拟机切换为主虚拟机;
[0024]响应于所述主虚拟机满足接收到所述关机指示并关机,将所述目标虚拟机组中的所述主虚拟机与备虚拟机都关闭;
[0025]响应于所述主虚拟机不满足运行状态异常且未接收到所述备机故障指示,确定所述主虚拟机的存储状态是否正常;
[0026]响应于所述主虚拟机的存储状态正常,确定所述备虚拟机出现故障,强制关闭所述备虚拟机;
[0027]响应于所述主虚拟机的存储状态异常,确定所述备虚拟机的存储状态是否正常;
[0028]响应于所述备虚拟机的存储状态正常,将所述备虚拟机切换为主虚拟机;
[0029]响应于所述备虚拟机的存储状态异常,确定所述备虚拟机出现故障,强制关闭所述备虚拟机。
[0030]可选的,在所述状态指示信息为关机指示时,所述控制节点针对所述状态指示信息对所述目标虚拟机组进行仲裁处理,包括:
[0031]确定所述目标虚拟机组中主虚拟机与备虚拟机是否均关机;
[0032]响应于所述主虚拟机或所述备虚拟机未关机,将所述主虚拟机与所述备虚拟机强制关机。
[0033]可选的,所述方法在强制关闭所述备虚拟机后还包括针对所述主虚拟机创建新的备虚拟机;
[0034]所述方法在创建新的备虚拟机时保持新的备虚拟机中网卡设备处于关闭状态直至需要新的备虚拟机提供服务。
[0035]可选的,所述虚拟化管理平台中设置有多个所述控制节点;
[0036]在所述计算节点将所述状态指示信息转发至所述控制节点后,还包括:
[0037]所述控制节点针对所述状态指示信息进行判断,以确定是否第一次接收到所述状态指示信息;
[0038]若是第一次接收到所述状态指示信息,将所述状态指示信息写入数据库进行记录。
[0039]可选的,在将所述故障事件消息发送至所述计算节点后,还包括:
[0040]利用所述计算节点根据所述事件消息判断所述目标虚拟机组是否为热备虚拟机组。
[0041]可选的,所述计算节点选用所述虚拟化管理平台中的compute组件,所述控制节点选用所述虚拟化管理平台中conductor组件。
[0042]在第二方面,本说明书实施例还提供了一种虚拟机故障处理系统,所述系统包括虚拟机监视器、计算节点单元与控制节点单元;
[0043]所述虚拟机监视器,用于对目标虚拟机组进行监控,以确定所述目标虚拟机组是否出现故障;
[0044]所述虚拟机监视器,还用于在所述目标虚拟机组出现故障时,生成故障事件消息并将所述故障事件消息发送至所述计算节点单元;
[0045]所述计算节点单元,用于从所述故障事件消息中提取所述目标虚拟机组的状态指示信息并转发至所述控制节点单元;所述状态指示信息包括备机故障指示、主备切换指示以及关机指示;
[0046]所述控制节点单元,用于针对所述状态指示信息对所述目标虚拟机组进行仲裁处理。
[0047]在第三方面,本说明书实施例还提供了一种虚拟机故障处理电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述的虚拟机故障处理方法。
[0048]从上面可以看出,本说明本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种虚拟机故障处理方法,其特征在于,所述方法应用于虚拟化管理平台,所述虚拟化管理平台包括监视器、计算节点与控制节点;所述方法包括:所述监视器对目标虚拟机组进行监控,以确定所述目标虚拟机组是否出现故障;在所述目标虚拟机组出现故障时,所述监视器生成故障事件消息并将所述故障事件消息发送至所述计算节点;所述计算节点从所述故障事件消息中提取所述目标虚拟机组的状态指示信息并转发至所述控制节点;所述状态指示信息包括备机故障指示、主备切换指示以及关机指示;所述控制节点针对所述状态指示信息对所述目标虚拟机组进行仲裁处理。2.根据权利要求1所述的方法,其特征在于,在所述状态指示信息为所述备机故障状态时,所述控制节点针对所述状态指示信息对所述目标虚拟机组进行仲裁处理,包括:确定所述目标虚拟机组中主虚拟机的存储状态是否正常;响应于所述主虚拟机的存储状态正常,强制关闭所述目标虚拟机组中的备虚拟机;响应于所述主虚拟机的存储状态异常,确定所述备虚拟机的存储状态是否正常;响应于所述备虚拟机的存储状态异常,强制关闭所述备虚拟机;响应于所述备虚拟机的存储状态正常,确定所述备虚拟机的运行状态是否正常;响应于所述备虚拟机的运行状态异常,强制关闭所述备虚拟机;响应于所述备虚拟机的运行状态正常,将所述备虚拟机切换为主虚拟机。3.根据权利要求1所述的方法,其特征在于,在所述状态指示信息为所述主备切换状态时,所述控制节点针对所述状态指示信息对所述目标虚拟机组进行仲裁处理,包括:确定所述目标虚拟机组中主虚拟机是否正在被删除;响应于所述主虚拟机正在被删除,终止删除操作并生成示警信息;响应于所述主虚拟机未被删除,确定所述主虚拟机的运行状态并确定所述主虚拟机是否接收到所述备机故障指示;响应于所述主虚拟机满足运行状态异常且未接收到所述备机故障指示,确定所述主虚拟机是否接收到所述关机指示并关机;响应于所述主虚拟机不满足接收到所述关机指示并关机,将所述目标虚拟机组中的备虚拟机切换为主虚拟机;响应于所述主虚拟机满足接收到所述关机指示并关机,将所述目标虚拟机组中的所述主虚拟机与备虚拟机都关闭;响应于所述主虚拟机不满足运行状态异常且未接收到所述备机故障指示,确定所述主虚拟机的存储状态是否正常;响应于所述主虚拟机的存储状态正常,确定所述备虚拟机出现故障,强制关闭所述备虚拟机;响应于所述主虚拟机的存储状态异常,确定所述备虚拟...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:安超云软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1