一种虚拟机故障处理方法和设备技术

技术编号:9720352 阅读:98 留言:0更新日期:2014-02-27 07:37
本发明专利技术公开了一种虚拟机故障处理方法和设备,该方法包括:虚拟路由器利用NQA功能探测VM是否发生故障;在所述VM发生故障时,所述虚拟路由器确定所述VM的故障类型;所述虚拟路由器向物理主机发送故障通知消息;所述物理主机在确定所述VM为运行在本物理主机的VM时,利用所述VM的故障类型对所述VM进行故障处理。本发明专利技术实施例中,VM不需要安装HA工具,能够快速恢复网络连通,并可以避免业务应用中断。

【技术实现步骤摘要】
一种虚拟机故障处理方法和设备
本专利技术涉及通信
,尤其涉及一种虚拟机故障处理方法和设备。
技术介绍
虚拟化技术是指计算机元件在虚拟基础上运行,而不是在真实基础上运行,虚拟 化技术可以扩大硬件容量,简化软件的重新配置过程。在虚拟化技术中,通常使用虚拟平台 的HA (High Availability,高可用性)技术来提高业务应用的可靠性。如图1所示,为虚 拟平台的HA技术的组网示意图。该网络中包括多个物理主机,各物理主机上运行多个VM (Virtual Machine,虚拟机),且相关业务应用将安装在VM上,以通过VM为用户提供各种应 用服务。虚拟平台的HA技术的网络分为控制网络和业务网络,虚拟平台的物理主机的控 制接口连接到控制网络中,且各物理主机之间通过控制网络进行通信;虚拟平台的物理主 机的业务接口连接到业务网络中,且物理主机上的VM将通过业务接口连接到业务网络中, 以对外提供业务服务。此外,控制网络和业务网络之间是相互隔离的,即控制网络和业务网 络之间不能进行通信。现有技术中,在基于虚拟平台的HA技术来保证业务应用的高可靠性时,采用如下 方式来保证业务的可用性。1、物理主机备份功能:虚拟平台的多台物理主机之间建立HA集 群,每台物理主机配有一个HA代理,各物理主机的HA代理在控制网络中周期性发送心跳报 文,并检测HA集群内其它物理主机的心跳报文。如果在某一周期内没有检测到其它物理主 机的心跳报文,则认为该物理主机故障,并将该其它物理主机上运行的所有VM迁移到HA集 群的其它物理主机上,从而保证物理主机故障情况下的业务可用性。2、VM检测/备份功能: 各VM中安装HA工具,各VM的HA工具周期性向物理主机发送心跳报文,如果在一定时间段 内物理主机没有收到HA工具的心跳报文,则判断该HA工具对应的VM异常,对VM进行重启 或者重新配置,以防止VM故障。在上述实现方式中,各VM均需要安装HA工具,如果VM由于使用非标准操作系统 导致无法安装HA工具,则无法实现VM检测/备份功能。HA工具能够发送心跳报文时,并不 能保证VM可以提供正常业务应用,因此物理主机无法准确及时对VM进行重启或者重新配 置,从而导致业务应用中断。此外,各物理主机的HA代理只能在控制网络中发送心跳报文, 无法在业务网络中发送心跳报文,因此当业务网络出现异常时不能通过物理主机备份功能 进行解决。
技术实现思路
本专利技术实施例提供一种虚拟机故障处理方法和设备,以避免在VM上安装HA工具, 避免业务应用中断,且在业务网络异常时对VM进行故障处理。为了达到上述目的,本专利技术实施例提供一种虚拟机故障处理方法,该方法应用于 包括多个物理主机的高可用性HA网络中,各物理主机上运行有虚拟机VM,且所述多个物理主机中的一个物理主机上运行有虚拟路由器,所述方法包括以下步骤:所述虚拟路由器利用网络质量分析NQA功能探测VM是否发生故障;在所述VM发生故障时,所述虚拟路由器确定所述VM的故障类型;所述虚拟路由器向物理主机发送故障通知消息,所述故障通知消息中携带所述VM 的地址信息以及所述VM的故障类型;由所述物理主机在利用所述VM的地址信息确定所述VM为运行在本物理主机的VM 时,利用所述VM的故障类型对所述VM进行故障处理。所述虚拟路由器探测VM是否发生故障,以及确定所述VM的故障类型的过程,具体 包括:当所述VM上的业务应用为NQA功能支持的业务应用时,所述虚拟路由器向所述 VM发送业务探测报文;如果未收到业务探测响应报文,则确定所述VM发生故障;所述虚拟 路由器向所述VM发送网络探测报文;如果未收到网络探测响应报文,则确定所述VM的故障 类型为网络连接故障;如果收到网络探测响应报文,则确定所述VM的故障类型为VM业务异 常;当所述VM上的业务应用为NQA功能不支持的业务应用时,所述虚拟路由器向所述 VM发送网络探测报文;如果未收到网络探测响应报文,则确定所述VM发生故障,并确定所 述VM的故障类型为网络连接故障。所述虚拟路由器向物理主机发送故障通知消息的过程,具体包括:当在所述虚拟路由器上配置HA工具时,所述虚拟路由器通过所述HA工具向本虚 拟路由器所在的物理主机发送故障通知消息;由所述物理主机在利用所述VM的地址信息 确定所述VM为运行在本物理主机的VM时,利用所述VM的故障类型对所述VM进行故障处 理;在利用所述VM的地址信息确定所述VM不是运行在本物理主机的VM时,通过心跳消息 将所述VM的地址信息以及所述VM的故障类型通知给其它物理主机;或者,当在所述虚拟路由器上配置HA代理时,所述虚拟路由器通过所述HA代理向所有 物理主机发送故障通知消息;由各物理主机在利用所述VM的地址信息确定所述VM为运行 在本物理主机的VM时,利用所述VM的故障类型对所述VM进行故障处理;在利用所述VM的 地址信息确定所述VM不是运行在本物理主机的VM时,丢弃本物理主机收到的故障通知消 肩、O所述物理主机利用所述VM的故障类型对所述VM进行故障处理的过程,具体包括: 在所述VM的故障类型为VM业务异常时,所述物理主机重启所述VM或者重新配置所述VM ; 或者,在所述VM的故障类型为网络连接故障时,所述物理主机将所述VM迁移到所述HA网 络中的其它物理主机上。本专利技术实施例提供一种虚拟路由器,应用于包括多个物理主机的高可用性HA网 络中,各物理主机上运行有虚拟机VM,且所述多个物理主机中的一个物理主机上运行有虚 拟路由器,所述虚拟路由器具体包括:探测模块,用于利用网络质量分析NQA功能探测VM是否发生故障;确定模块,用于在所述VM发生故障时,确定所述VM的故障类型;发送模块,用于向物理主机发送故障通知消息,所述故障通知消息中携带所述VM 的地址信息以及所述VM的故障类型;由所述物理主机在利用所述VM的地址信息确定所述VM为运行在本物理主机的VM 时,利用所述VM的故障类型对所述VM进行故障处理。所述探测模块,具体用于当所述VM上的业务应用为NQA功能支持的业务应用时, 向所述VM发送业务探测报文;如果未收到业务探测响应报文,则向所述VM发送网络探测报 文;或者,当所述VM上的业务应用为NQA功能不支持的业务应用时,向所述VM发送网络探 测报文;所述确定模块,具体用于当所述VM上的业务应用为NQA功能支持的业务应用时, 如果未收到业务探测响应报文,则确定所述VM发生故障;在向所述VM发送网络探测报文之 后,如果未收到网络探测响应报文,则确定所述VM的故障类型为网络连接故障;如果收到 网络探测响应报文,则确定所述VM的故障类型为VM业务异常;或者,当所述VM上的业务应 用为NQA功能不支持的业务应用时,如果未收到网络探测响应报文,则确定所述VM发生故 障,并确定所述VM的故障类型为网络连接故障。所述发送模块,具体用于当在所述虚拟路由器上配置HA工具时,通过所述HA工具 向本虚拟路由器所在的物理主机发送故障通知消息;由所述物理主机在利用所述VM的地 址信息确定所述VM为运行在本物理主机的VM时,利用所述VM的故障类型对所述VM进行 故障处理;在利用所述VM的地址信息确定所述VM不是运行在本物理主机的VM时,通过心 跳消息将所述VM的地址信息以及所述V本文档来自技高网
...
一种虚拟机故障处理方法和设备

【技术保护点】
一种虚拟机故障处理方法,该方法应用于包括多个物理主机的高可用性HA网络中,各物理主机上运行有虚拟机VM,且所述多个物理主机中的一个物理主机上运行有虚拟路由器,其特征在于,所述方法包括以下步骤:所述虚拟路由器利用网络质量分析NQA功能探测VM是否发生故障;在所述VM发生故障时,所述虚拟路由器确定所述VM的故障类型;所述虚拟路由器向物理主机发送故障通知消息,所述故障通知消息中携带所述VM的地址信息以及所述VM的故障类型;由所述物理主机在利用所述VM的地址信息确定所述VM为运行在本物理主机的VM时,利用所述VM的故障类型对所述VM进行故障处理。

【技术特征摘要】
1.一种虚拟机故障处理方法,该方法应用于包括多个物理主机的高可用性HA网络中, 各物理主机上运行有虚拟机VM,且所述多个物理主机中的一个物理主机上运行有虚拟路由器,其特征在于,所述方法包括以下步骤:所述虚拟路由器利用网络质量分析NQA功能探测VM是否发生故障;在所述VM发生故障时,所述虚拟路由器确定所述VM的故障类型;所述虚拟路由器向物理主机发送故障通知消息,所述故障通知消息中携带所述VM的地址信息以及所述VM的故障类型;由所述物理主机在利用所述VM的地址信息确定所述VM为运行在本物理主机的VM时, 利用所述VM的故障类型对所述VM进行故障处理。2.如权利要求1所述的方法,其特征在于,所述虚拟路由器探测VM是否发生故障,以及确定所述VM的故障类型的过程,具体包括:当所述VM上的业务应用为NQA功能支持的业务应用时,所述虚拟路由器向所述VM发送业务探测报文;如果未收到业务探测响应报文,则确定所述VM发生故障;所述虚拟路由器向所述VM发送网络探测报文;如果未收到网络探测响应报文,则确定所述VM的故障类型为网络连接故障;如果收到网络探测响应报文,则确定所述VM的故障类型为VM业务异常;当所述VM上的业务应用为NQA功能不支持的业务应用时,所述虚拟路由器向所述VM 发送网络探测报文;如果未收到网络探测响应报文,则确定所述VM发生故障,并确定所述 VM的故障类型为网络连接故障。3.如权利要求1所述的方法,其特征在于,所述虚拟路由器向物理主机发送故障通知消息的过程,具体包括:当在所述虚拟路由器上配置HA工具时,所述虚拟路由器通过所述HA工具向本虚拟路由器所在的物理主机发送故障通知消息;由所述物理主机在利用所述VM的地址信息确定所述VM为运行在本物理主机的VM时,利用所述VM的故障类型对所述VM进行故障处理;在利用所述VM的地址信息确定所述VM不是运行在本物理主机的VM时,通过心跳消息将所述 VM的地址信息以及所述VM的故障类型通知给其它物理主机;或者,`当在所述虚拟路由器上配置HA代理时,所述虚拟路由器通过所述HA代理向所有物理主机发送故障通知消息;由各物理主机在利用所述VM的地址信息确定所述VM为运行在本物理主机的VM时,利用所述VM的故障类型对所述VM进行故障处理;在利用所述VM的地址信息确定所述VM不是运行在本物理主机的VM时,丢弃本物理主机收到的故障通知消息。4.如权利要求1或3所述的方法,其特征在于,所述物理主机利用所述VM的故障类型对所述VM进行故障处理的过程,具体包括:在所述VM的故障类型为VM业务异常时,所述物理主机重启所述VM或者重新配置所述 VM ;或者,在所述VM的故障类型为网络连接故障时,所述物理主机将所述VM迁移到所述HA 网络中的其它物理主机上。5.一种虚拟路由器,应用于包括多个物理主机的高可用性HA网络中,各物理主机上运行有虚拟机VM,且所述多个物理主机中的一个物理主机上运行有虚拟路由器,其特征在于, 所述虚拟路由器具体包括:探测模块,用于利用网络质量分析NQA功能探测VM是否发生故障;确定模块,用于在所述VM发生故障时,确定所述VM的故障类型;发送模块,用于向物理主机发送故障通知消息,所述故障通知消息中携带所述VM的地址信息以及所述VM的故障类型;由所述物理主机在利用所述VM的地址信息确定所述VM为运行在本物理主机的VM时, 利用所述VM的故障类型对所述VM进行故障处理。6.如权利要求5所述的虚拟路由器,其特征在于,所述探测模块,具体用于当所述VM上的业务应用为NQA功能支持的业务应用时,...

【专利技术属性】
技术研发人员:李鑫黄杰姝
申请(专利权)人:杭州华三通信技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1