集群系统的心跳机构技术方案

技术编号:2856781 阅读:209 留言:0更新日期:2012-04-11 18:40
一种包括多个节点的集群的心跳机构,包括:    一个法定文件,用于从该多个节点接收心跳消息;    一个网络控制器,连接该法定文件至该多个节点,其中该网络控制器根据IEEE1394协议提供与该法定文件的通信。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及集群系统,更具体地说,涉及具有一个心跳系统和方法的集群系统。
技术介绍
一个集群是作为单个系统互相协作的一组独立的服务器。主要的集群元件是处理器节点、集群互连(专用网络)、和一个磁盘子系统。多个集群共享磁盘存取和管理数据的资源,但每个不同的硬件集群节点不共享存储器。每一节点具有自己专用的系统存储器以及自己的操作系统、数据库实例和应用软件。集群相对单个对称的多处理器系统可以改善故障复原和模块化增加系统的增长。在子系统出现故障的情况下,集群可以保证较高的可用性。冗余的硬件元件,如其他的节点、互连及共享的磁盘提供了更高的可用性。这样的冗余硬件结构避免了单个的多点故障并提供故障复原。在一个数据库集群中,每个节点对于CPU和存储器的需求随数据库的应用不同可以变化。性能和费用要求也在数据库的应用之间变化。影响性能的一个因素是集群中的每一节点需要让该集群中的其他节点不断通知其状况和构造。这通过周期性地经过网络广播一条被称作心跳(heartbeat)的网络消息来实现。该心跳信号通常通过一个专用网络、一个用来进行节点间通信的集群互连来发送。然而,丢失的或延迟的心跳消息可能产生节点没有发生作用的错误报告。在现有的系统中,已经通过在每个节点安装网卡并通过一个适当的网络电缆对他们进行连接并配置一个软件协议在线路上运行来构建集群互连。该互连通常是一个低成本/低速度运行TCP/IP或UDP的以太网卡,或者是高成本/高速度的专用互连,如Compaq的运行可靠数据报(RDG)的存储信道或超通信协议(HMP)的Hewlett-Packard的Hyperfabric/2。一种低成本/高速度的互连将降低用户的集群成本并减少运行期间的等待时间。本专利技术提供了一种新的有用的解决上述问题的集群方法和系统。
技术实现思路
在一个实施例中,提供了一种包括多个节点的集群系统的心跳机构。一方面,该系统包括一个法定(quorum)文件,该文件从多个节点接收心跳消息。一个网络控制器连接该法定文件至多个节点,在该多个节点处该网络控制器根据IEEE 1394协议提供与该法定文件的通信。根据本专利技术的另一实施例,提供了一种监视集群中的节点的方法。一个法定文件被分配用来存储从集群中的多个节点接收的状态消息。指示节点是活动的状态消息周期性地从集群中的节点处接收,在该集群中,该状态消息是基于IEEE 1394通信协议而被接收的。附图说明在结合到本说明书的部分以及构成本说明书的部分的附图中,阐明了本专利技术系统和方法的实施例,其连同下面给出的详细描述用于描述该系统和方法的示例性实施例。应该理解,图中示出的元件(如逻辑单元或逻辑单元组)的边界表示多个边界的一个例子。本领域技术人员可以理解一个元件可被设计为多个元件或多个元件可被设计为一个元件。图中作为另一个元件的内部构件的一个元件也可作为一个外部构件来实施,反之亦然。图1是根据本专利技术的集群节点的一个实施例的示例性系统框图。图2是图1的互联总线控制器的示例性框图。图3是一个共享的磁盘集群结构的示例。图4是一个不共享的集群结构的示例。图5是利用该互联总线传送数据的示例方法。图6是检测拓扑变换的示例方法。图7是检测拓扑变换的另一示例方法。图8是包括一个心跳系统的集群的另一实施例。图9是一个心跳系统的另一实施例。图10是保持一个法定文件的示例方法。图11是利用该法定文件确定节点状态的示例方法。具体实施例方式如下将包括贯穿全文所用的选定术语的定义。所有术语的单数或复数形式均属于同一含义这里使用的“计算机可读介质”是指参与直接或间接提供信号、指令和/或数据给处理器以用于执行的任意介质。这种介质可以具有任意的形式,包括但不仅限于非易失性介质、易失性介质及传输媒介。非易失性介质例如可包括光盘或磁盘。易失性介质可包括动态存储器。传输媒介可包括同轴电缆、铜线、及光纤电缆。传输媒介也可以是声或光波的形式,如那些在无线电波及红外数据通信过程中产生的波。计算机可读介质的共同形式包括如软盘、硬盘、磁带或任何其它磁介质,CD-ROM,任何其它光介质、穿孔卡片、纸带、任何其它具有孔模式的物理介质,RAM、PROM、EPROM、光闪EPROM,任何其它存储芯片或编码磁带、载波/脉冲,或其它任何计算机可读的介质。这里使用的“逻辑”包括但不限于硬件、固件、软件和/或每种的组合,以执行一种或多种功能或一个或多个动作,和/或由另一元件导致的功能或动作。例如,根据一种期望的应用或需要,逻辑可以包括一种软件控制的微处理器,分立的逻辑如专用集成电路(ASIC),或其它可编程逻辑设备。逻辑也可全部由软件来实施。这里使用的“信号”包括但不仅限于一个或多个电信号、模拟或数字信号、信号状态的变化(如电压升/降)、一个或多个计算机指令、消息、一比特或比特流、或其他可被接收、发射和/或检测的手段。这里使用的“软件”包括但不仅限于使计算机或其它电设备以期望的方式执行功能、动作和/或行为的一个或多个计算机可读和/或可执行指令。这些指令可以以各种形式——如程序、算法、模块或包括来自动态链接库的独立应用或代码的程序——来实施。软件也可以以各种形式——如单机程序、功能调用、小服务程序、java程序、存储在存储器中指令、部分操作系统或其它类型的可执行指令——来执行。本领域技术人员可以理解软件的形式取决于如期望应用的需要、运行的环境、和/或设计者/程序员等的要求。图1示出了根据本专利技术实施例的—个简化集群数据库系统100的一个实施例。虽然该实施例中示出了两个节点,节点105和110,在不同的结构中可以采用和集群不同数目的节点。虽然采用一个数据库集群作为一个实例,该系统也可应用于其它类型的集群系统。每一节点是一个执行软件和处理信息的计算机系统。该计算机系统可以是一个个人计算机、一个服务器或其它计算设备。每一节点也可包括多种元件和设备,如一个或多个处理器115、操作系统120、存储器、数据存储设备、数据通信总线及网络通信设备。每一节点可具有区别于其它节点的不同结构。一种类型的集群系统的示例被描述于申请号为6353836、标题为“METHOD AND APPARATUS FORTRANSFERRING DATA FROM THE CACHE OF ONE NODE TO THECACHE OF ANOTHER NODE(从一个节点的高速缓冲存储器传送数据到另一节点的高速缓冲存储器的方法和设备)”的美国专利申请,并被分配给当前受让人,该申请在此全部引用作为参考。进一步参考图1,节点105用于描述集群数据库系统100中的一个节点的配置的一个例子。在该实施例中,多个节点以一种数据共享的结构方式构成网络,其中每一节点可以访问一个或多个数据存储设备125。该数据存储设备125保存多个文件,如可由集群中连接的节点共享的数据库文件。网络控制器130将节点105连接到网络135。操作系统120包括运行于节点105的软件应用程序和网络控制器130间的一个通信接口。例如,该接口可以是一个网络设备驱动器140,该驱动器140根据网络135所选择的通信协议进行编程。可用于网络控制器130和网络135的通信协议的例子包括光纤信道ANSI标准X3.230和/或SCSI-3ANSI标准X.3270。该光纤信道结构提供本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种包括多个节点的集群的心跳机构,包括一个法定文件,用于从该多个节点接收心跳消息;一个网络控制器,连接该法定文件至该多个节点,其中该网络控制器根据IEEE 1394协议提供与该法定文件的通信。2.如权利要求1所述的心跳机构,其中该网络控制器是一个IEEE 1394卡。3.如权利要求1所述的心跳机构,其中该法定文件包括位于一个存储设备中的存储器。4.如权利要求3所述的心跳机构,其中该存储设备包括该法定文件和由该多个节点共享的文件。5.如权利要求1所述的心跳机构,进一步包括一个包含在该网络控制器中用于根据该IEEE 1394协议识别活动节点的节点图。6.如权利要求5所述的心跳机构,进一步包括状态逻辑,用于通过比较由该节点和该节点图写在该法定文件中的心跳消息来确定多个节点中的一个节点的状态。7.如权利要求1所述的心跳机构,其中该心跳消息包括一个时间戳。8.如权利要求1所述的心跳机构,其中该集群是一个数据库集群。9.一个集群系统,包括一个或多个共享文件;多个集中在一起并能够访问该共享文件的节点;一个法定文件,用于根据IEEE 1394协议与多个节点中的每一个进行通信,该法定文件存储多个节点的每一个的状态消息。10.如权利要求9所述的集群系统,其中该法定文件被保存在一个或多个第一存储设备中,且该共享文件被保存在一个或多个区别于第一存储设备的第二存储设备中。11.如权利要求9所述的集群系统,其中该法定文件和该共享文件保存在一个或多个公共存储设备中。12.如权利要求9所述的集群系统,进一步包括用于提供该共享文件和该多个节点间的通信的第一网络;用于提供该法定文件和该多个节点间的通信的第二网络。13.如权利要求12所述的集群系统,其中该第一网络和该第二网络根据IEEE 1394协议传送数据。14.如权利要求12所述的集群系统,其中该第一网络和该第二网络是相同的一网络。15.如权利要求9所述的集群系统,其中该状态消息包括一个时间戳。16.如权利要求9所述的集群系统,进一步包括一个用于连接该多个节点至该一个或多个共享文件和该法定文件的公共网络。17.如权利要求9所述的集群系统,进一步包括一个保存在多个节点中的每一个中的心跳逻辑,其周期性的产生一个状态消息并根据IEEE 1394协议发送该状态消息至该法定文件。18.如权利要求9所述的集群系统,其中该集群系统包括一个数据库集群。19.一种...

【专利技术属性】
技术研发人员:威姆·A·科凯尔茨
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1