一种实现虚拟机高可用性的方法及装置制造方法及图纸

技术编号:16837149 阅读:32 留言:0更新日期:2017-12-19 19:46
本发明专利技术涉及一种实现虚拟机高可用性的方法及装置。该方法包括:接收zookeeper发送的虚拟机集群中第一虚拟机的心跳异常的通知消息;根据第一虚拟机的标识信息,确定安装第一虚拟机的第一物理机;检测第一物理机的心跳;当确定第一物理机的心跳未发生异常时,定位业务系统发生故障的位置在第一虚拟机;或者,当确定第一物理机的心跳发生异常时,检测与第一物理机属于同一网段的第二物理机的心跳;根据第二物理机的心跳,确定业务系统发生故障的位置在第一物理机与服务器之间的网络或者为第一物理机。通过上述检测方法,可以确定发生故障的为第一虚拟机或第一物理机,又或者为第一物理机与服务器之间的网络。从而根据发生故障的位置不同,做出不同的处理。

A method and device for realizing high availability of virtual machine

The invention relates to a method and device for realizing high availability of a virtual machine. The method includes: receiving a notification message sent by the zookeeper virtual machine cluster in the first virtual machine abnormal heartbeat; according to the identification information of the first virtual machine, first determine the physical machine installation of the first virtual machine; test the first physical machine heartbeat; when it is determined that the first physical machine without heart failure occurs when an exception occurs, the positioning service system the position in the first virtual machine; or, when it is determined that the first physical machine heart abnormal, second physical machine detection and the first physical machine belonging to the same segment of the heartbeat; according to the second physical machine heartbeat, determine the network fault location service system between the first physical machine with the server or the first physical machine. Through the above detection method, we can confirm that the fault is the first virtual machine or the first physical machine, or the network between the first physical machine and the server. According to the different position of the fault, different processing is made.

【技术实现步骤摘要】
一种实现虚拟机高可用性的方法及装置
本专利技术涉及电信领域,尤其涉及一种实现虚拟机高可用性的方法及装置。
技术介绍
现有技术中,为了实现业务系统的高可用性(HighAvailability,简称HA),就是在业务系统发生中断时,将发生中断位置设置的虚拟机所承载的业务自动快速的迁移到虚拟机集群中其他虚拟机上,以此来保证业务的连续性。具体监控业务系统是否发生中断,主要是利用server端对资源池中的虚拟机进行心跳监控。当server端检测不到虚拟机心跳时,则直接认为虚拟机故障,需要对虚拟机进行恢复,如果恢复失败,则对恢复失败的虚拟机进行迁移。但是,实际上而言,业务系统中所包括的不仅仅是虚拟机,还包括承载虚拟机的物理机,物理机和其他设备之间建立通信连接的网络。如果仅仅是server监控不到虚拟机的心跳,就果断的认为业务系统中断是由虚拟机造成,然后将该虚拟机所承载的业务迁移到其他虚拟机上,势必会造成资源迁移、资源占用等情况,由此增加对集群资源的消耗,甚至会对业务造成连续性的影响。因此,如何精确的实现虚拟机高可用性,是亟待解决的技术问题。
技术实现思路
为解决上述技术问题,本专利技术提供了一种实现虚拟机高可用性的方法及装置。第一方面,本专利技术提供了一种实现虚拟机高可用性的方法,该方法包括:接收zookeeper发送的虚拟机集群中第一虚拟机的心跳异常的通知消息,其中通知消息中携带第一虚拟机的标识信息;根据第一虚拟机的标识信息,确定安装第一虚拟机的第一物理机;检测第一物理机的心跳;当确定第一物理机的心跳未发生异常时,定位业务系统发生故障的位置在第一虚拟机;或者,当确定第一物理机的心跳发生异常时,检测与第一物理机属于同一网段的第二物理机的心跳;根据第二物理机的心跳,确定业务系统发生故障的位置在第一物理机与服务器之间的网络或者在第一物理机。本专利技术的有益效果是:当zookeeper检测到第一物理机的心跳异常时,发送通知消息至服务器。服务器则根据第一虚拟机的标识信息,确定承载第一虚拟机的第一物理机。然后检测第一物理机的心跳,根据第一物理机的心跳判断是否为第一虚拟机故障。若检测并非为第一虚拟机故障时,则还需要利用第二物理机检测第一物理机的心跳。通过上述方式,可以精确的确定发生故障的位置在第一虚拟机,还是第一物理机,由或是第一物理机和服务器之间的网络。从而根据发生故障的位置不同,做出不同的处理。而且,还可以避免一旦检测虚拟机故障,就将业务转移而造成的资源迁移、资源占用等情况,进而可以降低对集群资源的消耗,避免对业务造成连续性的影响,提升虚拟机的高可用性。进一步,根据第二物理机的心跳,确定业务系统发生故障的位置在第一物理机与服务器之间的网络或者在第一物理机,具体包括:当第二物理机的心跳发生异常时,确定业务系统发生故障的位置在第一物理机与服务器之间的网络;或者,当第二物理机的心跳未发生异常时,控制第二物理机检测第一物理机的心跳;当第二物理机检测第一物理机的心跳异常时,业务系统发生故障的位置在第一物理机。采用上述进一步的方案的有益技术效果在于,如果确定第二物理机的心跳异常,则可以直接确定发生故障的位置在第一物理机和服务器之间的网络。而如果第二物理机的心跳并未发生异常,那么则可以利用第二物理机检测第一物理机的心跳。如果第二物理机检测第一物理机的心跳异常,那么就是服务器和第二物理机均不能够检测到第一物理机的心跳,则可以直接确定发生故障的位置在于第一物理机。进一步,当第二物理机检测第一物理机的心跳未发生异常时,确定业务系统发生故障的位置在第一物理机与服务器之间的网络。采用上述进一步的技术方案的有益技术效果在于,如果利用第二物理机检测第一物理机的心跳没有发生异常,而服务器确检测到第一物理的心跳异常,只能说明发生故障的位置在于第一物理机和服务器之间的网络。进一步的,当确定业务系统发生故障的位置在第一虚拟机时,重新启动第一虚拟机;若重新启动第一虚拟机后,检测第一虚拟机心跳仍然异常时,将第一虚拟机所承载的业务转移到虚拟机集群中除第一虚拟机之外的任一虚拟机上。采用上述进一步的技术方案的有益技术效果在于:当确定第一虚拟机发生故障时,也即是业务系统发生故障的位置在第一虚拟机时,可以尝试通过重新启动第一虚拟机,以便第一虚拟机能够自动修复。而如果重新启动之后,也不能修复第一虚拟机,则需要将第一虚拟机所承载的业务转移到虚拟机集群中其他虚拟机上进行处理。进一步的,当确定业务系统发生故障的位置在第一物理机与服务器之间的网络时,通知网络管理员修复第一物理机和服务器之间的网络;或者,当确定业务系统发生故障的位置在第一物理机时,当确定业务系统发生故障的位置在第一物理机时,对第一物理主机进行隔离和恢复;若对物理主机进行恢复失败时,则直接将第一虚拟机所承载的业务转移到虚拟机集群中除第一虚拟机之外的任一虚拟机上。采用上述进一步的技术方案的有益技术效果在于:准确的确定业务系统发生故障的位置在第一物理主机,还是在第一物理主机和服务器之间的网络。如果是网络,则不需要迁移业务,只要恢复网络通信即可。而如果是第一物理机故障,则需要将第一虚拟机的业务进行迁移。通过精确的定位业务系统发生故障的位置,从而采取不同的处理方式。可以有效的避免一旦检测虚拟机故障,就将业务转移而造成的资源迁移、资源占用等情况,进而可以降低对集群资源的消耗,避免对业务造成连续性的影响,提升虚拟机的高可用性。第二方面,本专利技术提供了一种实现虚拟机高可用性的装置,该装置包括:接收单元,用于接收zookeeper发送的虚拟机集群中第一虚拟机的心跳异常的通知消息,其中通知消息中携带第一虚拟机的标识信息;定位单元,用于根据第一虚拟机的标识信息,确定安装第一虚拟机的第一物理机;处理单元,用于检测第一物理机的心跳;当确定第一物理机的心跳未发生异常时,定位业务系统发生故障的位置在第一虚拟机;或者,当确定第一物理机的心跳发生异常时,检测与第一物理机属于同一网段的第二物理机的心跳;根据第二物理机的心跳,确定业务系统发生故障的位置在第一物理机与服务器之间的网络或者在第一物理机。上述方案的有益技术效果在于,当zookeeper检测到第一物理机的心跳异常时,发送通知消息至服务器。服务器则根据第一虚拟机的标识信息,确定承载第一虚拟机的第一物理机。然后检测第一物理机的心跳,根据第一物理机的心跳判断是否为第一虚拟机故障。若检测并非为第一虚拟机故障时,则还需要利用第二物理机检测第一物理机的心跳。通过上述方式,可以精确的确定发生故障的位置在第一虚拟机,还是第一物理机,由或是第一物理机和服务器之间的网络。从而根据发生故障的位置不同,做出不同的处理。而且,还可以避免一旦检测虚拟机故障,就将业务转移而造成的资源迁移、资源占用等情况,进而可以降低对集群资源的消耗,避免对业务造成连续性的影响,提升虚拟机的高可用性。进一步的,处理单元,具体用于:当第二物理机的心跳发生异常时,确定业务系统发生故障的位置在第一物理机与服务器之间的网络;或者,当第二物理机的心跳未发生异常时,控制第二物理机检测第一物理机的心跳;当第二物理机检测第一物理机的心跳异常时,业务系统发生故障的位置在第一物理机。采用上述进一步的方案的有益技术效果在于,如果确定第二物理机的心跳异常,则可以直接确定发本文档来自技高网...
一种实现虚拟机高可用性的方法及装置

【技术保护点】
一种实现虚拟机高可用性的方法,其特征在于,所述方法包括:接收zookeeper发送的虚拟机集群中第一虚拟机的心跳异常的通知消息,其中所述通知消息中携带所述第一虚拟机的标识信息;根据所述第一虚拟机的标识信息,确定安装所述第一虚拟机的第一物理机;检测所述第一物理机的心跳;当确定所述第一物理机的心跳未发生异常时,定位业务系统发生故障的位置在所述第一虚拟机;或者,当确定所述第一物理机的心跳发生异常时,检测与所述第一物理机属于同一网段的第二物理机的心跳;根据所述第二物理机的心跳,确定所述业务系统发生故障的位置在所述第一物理机与服务器之间的网络或者在所述第一物理机。

【技术特征摘要】
1.一种实现虚拟机高可用性的方法,其特征在于,所述方法包括:接收zookeeper发送的虚拟机集群中第一虚拟机的心跳异常的通知消息,其中所述通知消息中携带所述第一虚拟机的标识信息;根据所述第一虚拟机的标识信息,确定安装所述第一虚拟机的第一物理机;检测所述第一物理机的心跳;当确定所述第一物理机的心跳未发生异常时,定位业务系统发生故障的位置在所述第一虚拟机;或者,当确定所述第一物理机的心跳发生异常时,检测与所述第一物理机属于同一网段的第二物理机的心跳;根据所述第二物理机的心跳,确定所述业务系统发生故障的位置在所述第一物理机与服务器之间的网络或者在所述第一物理机。2.根据权利要求1所述的方法,其特征在于,根据所述第二物理机的心跳,确定所述业务系统发生故障的位置在所述第一物理机与服务器之间的网络或者在所述第一物理机,具体包括:当所述第二物理机的心跳发生异常时,确定所述业务系统发生故障的位置在所述第一物理机与服务器之间的网络;或者,当所述第二物理机的心跳未发生异常时,控制所述第二物理机检测所述第一物理机的心跳;当所述第二物理机检测所述第一物理机的心跳异常时,所述业务系统发生故障的位置在所述第一物理机。3.根据权利要求2所述的方法,其特征在于,当所述第二物理机检测所述第一物理机的心跳未发生异常时,确定所述业务系统发生故障的位置在所述第一物理机与服务器之间的网络。4.根据权利要求1-3任一项所述的方法,其特征在于,当确定所述业务系统发生故障的位置在所述第一虚拟机时,重新启动所述第一虚拟机;若重新启动所述第一虚拟机后,检测所述第一虚拟机心跳仍然异常时,将所述第一虚拟机所承载的业务转移到所述虚拟机集群中除所述第一虚拟机之外的任一虚拟机上。5.根据权利要求1-3任一项所述的方法,其特征在于,当确定所述业务系统发生故障的位置在所述第一物理机与服务器之间的网络时,通知网络管理员修复所述第一物理机和所述服务器之间的网络;或者,当确定所述业务系统发生故障的位置在所述第一物理机时,对所述第一物理主机进行隔离和恢复;若对所述物理主机进行恢复失败时,则直接将所述第一虚拟机所承载的业务转移到所述虚拟机集群中除所述第一虚拟机之外的任一虚拟机上。6.一种实现虚拟机高可用性的装置,其特征在于,所述装置包括...

【专利技术属性】
技术研发人员:徐庆洲
申请(专利权)人:北京思特奇信息技术股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1