The invention relates to a method and device for realizing high availability of a virtual machine. The method includes: receiving a notification message sent by the zookeeper virtual machine cluster in the first virtual machine abnormal heartbeat; according to the identification information of the first virtual machine, first determine the physical machine installation of the first virtual machine; test the first physical machine heartbeat; when it is determined that the first physical machine without heart failure occurs when an exception occurs, the positioning service system the position in the first virtual machine; or, when it is determined that the first physical machine heart abnormal, second physical machine detection and the first physical machine belonging to the same segment of the heartbeat; according to the second physical machine heartbeat, determine the network fault location service system between the first physical machine with the server or the first physical machine. Through the above detection method, we can confirm that the fault is the first virtual machine or the first physical machine, or the network between the first physical machine and the server. According to the different position of the fault, different processing is made.
【技术实现步骤摘要】
一种实现虚拟机高可用性的方法及装置
本专利技术涉及电信领域,尤其涉及一种实现虚拟机高可用性的方法及装置。
技术介绍
现有技术中,为了实现业务系统的高可用性(HighAvailability,简称HA),就是在业务系统发生中断时,将发生中断位置设置的虚拟机所承载的业务自动快速的迁移到虚拟机集群中其他虚拟机上,以此来保证业务的连续性。具体监控业务系统是否发生中断,主要是利用server端对资源池中的虚拟机进行心跳监控。当server端检测不到虚拟机心跳时,则直接认为虚拟机故障,需要对虚拟机进行恢复,如果恢复失败,则对恢复失败的虚拟机进行迁移。但是,实际上而言,业务系统中所包括的不仅仅是虚拟机,还包括承载虚拟机的物理机,物理机和其他设备之间建立通信连接的网络。如果仅仅是server监控不到虚拟机的心跳,就果断的认为业务系统中断是由虚拟机造成,然后将该虚拟机所承载的业务迁移到其他虚拟机上,势必会造成资源迁移、资源占用等情况,由此增加对集群资源的消耗,甚至会对业务造成连续性的影响。因此,如何精确的实现虚拟机高可用性,是亟待解决的技术问题。
技术实现思路
为解决上述技术问题,本专利技术提供了一种实现虚拟机高可用性的方法及装置。第一方面,本专利技术提供了一种实现虚拟机高可用性的方法,该方法包括:接收zookeeper发送的虚拟机集群中第一虚拟机的心跳异常的通知消息,其中通知消息中携带第一虚拟机的标识信息;根据第一虚拟机的标识信息,确定安装第一虚拟机的第一物理机;检测第一物理机的心跳;当确定第一物理机的心跳未发生异常时,定位业务系统发生故障的位置在第一虚拟机;或者,当确定第一 ...
【技术保护点】
一种实现虚拟机高可用性的方法,其特征在于,所述方法包括:接收zookeeper发送的虚拟机集群中第一虚拟机的心跳异常的通知消息,其中所述通知消息中携带所述第一虚拟机的标识信息;根据所述第一虚拟机的标识信息,确定安装所述第一虚拟机的第一物理机;检测所述第一物理机的心跳;当确定所述第一物理机的心跳未发生异常时,定位业务系统发生故障的位置在所述第一虚拟机;或者,当确定所述第一物理机的心跳发生异常时,检测与所述第一物理机属于同一网段的第二物理机的心跳;根据所述第二物理机的心跳,确定所述业务系统发生故障的位置在所述第一物理机与服务器之间的网络或者在所述第一物理机。
【技术特征摘要】
1.一种实现虚拟机高可用性的方法,其特征在于,所述方法包括:接收zookeeper发送的虚拟机集群中第一虚拟机的心跳异常的通知消息,其中所述通知消息中携带所述第一虚拟机的标识信息;根据所述第一虚拟机的标识信息,确定安装所述第一虚拟机的第一物理机;检测所述第一物理机的心跳;当确定所述第一物理机的心跳未发生异常时,定位业务系统发生故障的位置在所述第一虚拟机;或者,当确定所述第一物理机的心跳发生异常时,检测与所述第一物理机属于同一网段的第二物理机的心跳;根据所述第二物理机的心跳,确定所述业务系统发生故障的位置在所述第一物理机与服务器之间的网络或者在所述第一物理机。2.根据权利要求1所述的方法,其特征在于,根据所述第二物理机的心跳,确定所述业务系统发生故障的位置在所述第一物理机与服务器之间的网络或者在所述第一物理机,具体包括:当所述第二物理机的心跳发生异常时,确定所述业务系统发生故障的位置在所述第一物理机与服务器之间的网络;或者,当所述第二物理机的心跳未发生异常时,控制所述第二物理机检测所述第一物理机的心跳;当所述第二物理机检测所述第一物理机的心跳异常时,所述业务系统发生故障的位置在所述第一物理机。3.根据权利要求2所述的方法,其特征在于,当所述第二物理机检测所述第一物理机的心跳未发生异常时,确定所述业务系统发生故障的位置在所述第一物理机与服务器之间的网络。4.根据权利要求1-3任一项所述的方法,其特征在于,当确定所述业务系统发生故障的位置在所述第一虚拟机时,重新启动所述第一虚拟机;若重新启动所述第一虚拟机后,检测所述第一虚拟机心跳仍然异常时,将所述第一虚拟机所承载的业务转移到所述虚拟机集群中除所述第一虚拟机之外的任一虚拟机上。5.根据权利要求1-3任一项所述的方法,其特征在于,当确定所述业务系统发生故障的位置在所述第一物理机与服务器之间的网络时,通知网络管理员修复所述第一物理机和所述服务器之间的网络;或者,当确定所述业务系统发生故障的位置在所述第一物理机时,对所述第一物理主机进行隔离和恢复;若对所述物理主机进行恢复失败时,则直接将所述第一虚拟机所承载的业务转移到所述虚拟机集群中除所述第一虚拟机之外的任一虚拟机上。6.一种实现虚拟机高可用性的装置,其特征在于,所述装置包括...
【专利技术属性】
技术研发人员:徐庆洲,
申请(专利权)人:北京思特奇信息技术股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。