提供用于HA集群的管理程序的基于应用的监控及恢复制造技术

技术编号:10736900 阅读:120 留言:0更新日期:2014-12-10 12:29
本发明专利技术的实施例涉及一种与包括管理程序和来宾虚拟机的节点相关联的方法,其中,每个来宾虚拟机由管理程序管理,并被安排以运行应用,该节点与其它节点一起形成高可用性集群。该方法包括:在每个来宾虚拟机和管理程序之间建立内部双向通信通道,并还包括通过通道发送命令和对命令的响应,其中各个命令管理在给定来宾虚拟机上运行的指定应用。有选择地监控消息,以检测与在给定来宾虚拟机上运行的指定应用相关联的故障状态。响应于检测到故障状态,采取措施以纠正故障状态,其中,措施包括通过内部通道将至少一个命令从管理程序发送到给定来宾虚拟机。

【技术实现步骤摘要】
【国外来华专利技术】【专利摘要】本专利技术的实施例涉及一种与包括管理程序和来宾虚拟机的节点相关联的方法,其中,每个来宾虚拟机由管理程序管理,并被安排以运行应用,该节点与其它节点一起形成高可用性集群。该方法包括:在每个来宾虚拟机和管理程序之间建立内部双向通信通道,并还包括通过通道发送命令和对命令的响应,其中各个命令管理在给定来宾虚拟机上运行的指定应用。有选择地监控消息,以检测与在给定来宾虚拟机上运行的指定应用相关联的故障状态。响应于检测到故障状态,采取措施以纠正故障状态,其中,措施包括通过内部通道将至少一个命令从管理程序发送到给定来宾虚拟机。【专利说明】提供用于HA集群的管理程序的基于应用的监控及恢复
在此公开和要求保护的本专利技术一般涉及一种方法和装置,其中,管理程序被链接到一个或多个其它管理程序以形成高可用性(HA)集群。更具体地,本专利技术涉及一种上述类型的方法和装置,其中,每个管理程序可使得多个来宾操作系统或来宾虚拟机(VM)能够在主机计算平台上同时运行。
技术介绍
某些虚拟化管理产品通过在其产品供应中包括或嵌入HA集群产品来维持来宾VM的可用性。典型地,这些产品通过将底层管理程序形成为高可用性集群来工作,其中每个底层管理程序运行在物理机上。然后,在管理程序之间执行心跳。当集群的成员或者由于管理程序故障或者由于物理服务器故障而心跳故障时,所嵌入的HA集群技术在替代服务器上重新启动来宾VM,从而维持来宾VM的可用性。 该方法有很多局限性。例如,该方法不能检测来宾VM系统自身的故障并从中恢复,除了来宾的操作系统全部崩溃以外。这种方法只检测底层管理程序及其物理服务器的故障并从中恢复。它也不检测在来宾VM内运行的应用的故障并从中恢复。因此,应用可在来宾VM内运行时发生故障,而基于管理程序的集群没有注意到。在这种情况下,来宾机仍在运行,但不提供服务。这对虚拟化系统的可实现的可用性造成明显限制,因为故障通常是由于操作系统问题,应用崩溃并中止。此外,更复杂的关键业务应用要求应用级别的操作利用某个内置数据复制技术。如果没有来宾VM内的任何可见性,则不可能调用这些操作并利用内置特性。 此外,希望利用管理程序级别的HA特性或来宾VM内的HA特性的用户通常必须精通并必须安装管理程序级别和应用级别的HA集群管理器。同时,这种用户必须确保表示资源之间的关系和确保例如文件系统被安装在应用被启动或者数据复制对的接收机在另一个物理系统上被启动为发送机的地方的策略被管理程序级别和应用级别的HA系统维持。然而,这一级别的复杂性管理通常超出了大多数用户的能力。
技术实现思路
本专利技术的实施例可有选择地采用方法、计算机程序产品或装置的形式。针对方法的实施例与第一节点相关联,该第一节点包括管理程序和一个或多个来宾虚拟机(VM),其中,每个来宾虚拟机被安排以运行一个或多个应用,第一节点与一个或多个其它节点一起形成高可用性(HA)集群。该方法包括:在第一节点的每个来宾虚拟机和管理程序之间建立内部双向通信通道。该方法还包括:在管理程序和给定来宾VM之间,通过内部通道发送包括命令和对命令的响应的消息,其中,各个命令被发送以管理在给定来宾VM上运行的指定应用。有选择地监控消息,以检测与在给定来宾虚拟机上运行的指定应用相关联的故障状态的发生。响应于检测到故障状态,采取措施以纠正故障状态,其中,措施包括通过内部通道将至少一个命令从管理程序发送到给定来宾VM。 【专利附图】【附图说明】 图1A和IB是各自描绘HA节点集群的框图,其中实现了本专利技术的说明性实施例; 图2是说明用于图1A或IB的节点集群的节点的示意图; 图3是示出包括本专利技术的实施例的方法的步骤的流程图; 图4是示出可用作本专利技术的实施例的一个或多个组件的计算机或数据处理系统的框图。 【具体实施方式】 所属
的技术人员知道,本专利技术的各个方面可以实现为系统、方法或计算机程序产品。因此,本专利技术的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本专利技术的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包括计算机可读的程序代码。 可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是一但不限于一电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取内存(RAM)、只读内存(ROM)、可擦式可编程只读内存(EPR0M或闪存)、光纤、便携式紧凑盘只读内存(CD-ROM)、光内存件、磁内存件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包括或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。 计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。 计算机可读介质上包括的程序代码可以用任何适合的介质传输,包括一但不限于一无线、有线、光缆、RF等等,或者上述的任意合适的组合。 可以以一种或多种程序设计语言的任意组合来编写用于执行本专利技术操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言一诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言一诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络一包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。 下面将参照根据本专利技术实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本专利技术。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。 也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其它可编程数据处理装置、或其它设备以给定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定本文档来自技高网
...

【技术保护点】
一种方法,与第一节点相关联,所述第一节点包括管理程序和一个或多个来宾虚拟机(VM),其中每个来宾虚拟机被安排以运行一个或多个应用,所述第一节点与一个或多个其它节点一起形成高可用性(HA)集群,所述方法包括以下步骤:在所述第一节点的每个来宾虚拟机和管理程序之间,建立内部双向通信通道;在所述管理程序和给定来宾虚拟机之间,通过所述内部通道发送包括命令和对命令的响应的消息,其中,各个命令被发送以管理在所述给定来宾虚拟机上运行的指定应用;有选择地监控所述消息,以检测与在所述给定来宾虚拟机上运行的所述指定应用相关联的故障状态的发生;以及响应于检测到故障状态,采取措施以纠正所述故障状态,其中,所述措施包括通过所述内部通道将至少一个命令从所述管理程序发送到所述给定来宾虚拟机。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:M·穆勒M·米特尔施塔特R·E·哈珀L·F·斯帕诺维尔
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1