The invention discloses a method and device for fault monitoring of virtual machine cluster, receiving virtual machine cluster through the host abnormal heartbeat notification instruction; the host node according to the pre recorded information, determine the virtual machine local node is DC node; when the virtual machine for DC nodes, to determine whether the normal operation of the virtual machine; when the virtual machine is running normally, the host virtual machine as a DC node, and sent to another host message; when the virtual machine operation is abnormal, the running state of the host access to another host virtual machine, a virtual machine host to determine whether the normal operation; when another host virtual machine in normal operation, the other host virtual machine as DC node. This application through the host monitoring virtual machine cluster state, namely the use of their own resources to host fault monitoring of the cluster, without the aid of external tools, reduce the cost, and without the aid of external factors, the monitoring of self-control.
【技术实现步骤摘要】
一种虚拟机集群的故障监控方法及装置
本专利技术涉及虚拟机领域,特别是涉及一种虚拟机集群的故障监控方法及装置。
技术介绍
对于虚拟机集群,当一个控制器节点故障时,该节点上的相关资源服务会切换到另一个节点,然后在对需要对故障节点进行恢复,故集群故障监控显得尤为重要。在建立集群的每个控制器中都可以存在一个虚拟机,这些虚拟机要建立集群,并监控集群。在两个控制节点的情况下,如果虚拟机集群的心跳中断,两个节点孤立存在,法定节点数(quorum)就不起作用了,会造成这两个节点争抢资源,无法实现故障监控。针对两个控制节点的虚拟机集群,目前主要使用IPQuorum来实现监控,即通过外置IP连接集群的两个节点,当集群心跳中断时,哪个节点先与外置IP通信,拿到quorum,则将该节点作为DC节点继续工作,另一个节点释放资源。但是,这样需要提供外置IP的服务器,来提供IPQuorum,增加成本,同时增加一条外部通信链路就多一分风险,使得监控不可控。
技术实现思路
本专利技术的目的是提供一种虚拟机集群的故障监控方法及装置,目的在于解决现有技术中虚拟机集群监控方法的成本较高且不可控风险较高。为解 ...
【技术保护点】
一种虚拟机集群的故障监控方法,其特征在于,包括:宿主机接收虚拟机集群心跳发生异常的通知指令;所述宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点;当所述虚拟机为所述DC节点时,判断所述虚拟机运行是否正常;当所述虚拟机运行正常时,所述宿主机将所述虚拟机作为所述DC节点,并向另一宿主机发送消息;当所述虚拟机运行异常时,所述宿主机获取另一宿主机虚拟机的运行状态,判断所述另一宿主机虚拟机运行是否正常;当所述另一宿主机虚拟机运行正常时,将所述另一宿主机虚拟机作为所述DC节点。
【技术特征摘要】
1.一种虚拟机集群的故障监控方法,其特征在于,包括:宿主机接收虚拟机集群心跳发生异常的通知指令;所述宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点;当所述虚拟机为所述DC节点时,判断所述虚拟机运行是否正常;当所述虚拟机运行正常时,所述宿主机将所述虚拟机作为所述DC节点,并向另一宿主机发送消息;当所述虚拟机运行异常时,所述宿主机获取另一宿主机虚拟机的运行状态,判断所述另一宿主机虚拟机运行是否正常;当所述另一宿主机虚拟机运行正常时,将所述另一宿主机虚拟机作为所述DC节点。2.如权利要求1所述的故障监控方法,其特征在于,在所述宿主机根据预记录的节点信息,判断本地节点的虚拟机是否为DC节点之后还包括:当所述虚拟机为非DC节点时,所述宿主机获取所述另一宿主机虚拟机的所述运行状态,判断所述另一宿主机虚拟机运行是否正常;若正常,将所述另一宿主机虚拟机作为所述DC节点;若异常,结束进程。3.如权利要求1或2所述的故障监控方法,其特征在于,在所述宿主机接收虚拟机集群心跳发生异常的通知指令之前还包括:在所述虚拟机转为所述DC节点后,记录所述虚拟机的信息,得出所述节点信息。4.一种虚拟机集群的故障监...
【专利技术属性】
技术研发人员:耿东,张月辉,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。