当前位置: 首页 > 专利查询>诺基亚公司专利>正文

用于在集群系统的网络故障期间最大化连通性的系统和方法技术方案

技术编号:3504994 阅读:228 留言:0更新日期:2012-04-11 18:40
一种用于在网络集群系统中的网络故障之后用于最大化网络连通性的装置、方法和系统。集群中的集群主机配置用于部分基于成员到相邻网络的连通性,管理所述集群的成员资格。网络装置发送有关其连通性的信息到集群主机。集群主机比较所接收的信息以确定网络装置是否具有与该集群不同的连通性。如果网络装置具有不同的连通性,则集群主机可以拒绝给予该网络装置集群成员资格。通过拒绝具有不同连通性的网络装置,本发明专利技术确保由集群接收的数据实际上由任何集群成员以基本上相等的可靠性传递。从而,甚至可能拒绝集群主机成为集群的成员资格。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及计算系统,尤其涉及用于在网络集群系统中发生网络故障之后,最大化网络连通性的系统和方法。
技术介绍
如今,计算系统对于很多企业的成功变得越来越重要。由于计算机系统及其相关网络设施变得更为重要,这种系统的可用性成为关键性的。企业计算机网络中和/或它们的网络设施的故障可能给企业造成灾难性的损失。适应于提供计算机系统资源的高可用性和保护不受故障影响的计算设施的这种需求,提出了集群架构。集群可以定义为多个松散耦合的网络装置,它们通过网络合作以提供对服务、资源等的集合的客户端访问。集群中的成员可以用于提高访问的可靠性和可用性。很多集群架构依赖于以某种时间间隔的成员之间的集群心跳消息(有时称为保持活动消息)的交换,该时间间隔可根据网络上的分组丢失或类似因素而变化。集群可以利用这些保持活动消息管理集群成员资格、分配工作、并检测成员故障。如果在某个预定的超时期间没有接收到来自集群的某个成员的这种保持活动消息,该未响应的集群成员可能就会被迫离开集群。如果集群成员的网络装置出故障,或者类似的情况,这种响应可能适合单个集群成员未能响应的情况。然而,如果所有的集群成员都连接到诸如交换机、集线器、以及类似设备的同一网络设备,并且该网络设备发生了故障,就是说由于交换机、集线器的故障,那么所有的集群成员都可能离开该集群系统。这种行为可能导致到该集群系统所服务的所有剩余网络的连通性的完全丧失。很不幸的是,作为解决方案的增加网络设备冗余对于很多企业来说可能太昂贵。因此,在产业中存在对于高度可靠的集群基础设施的需求。由此,本专利技术是关于这些以及其他考虑而提出的。附图说明将参考以下图示描述本专利技术的非限制和非详尽实施例。在附图中,除非另外指定,类似的附图标记表示贯穿各图的类似部分。为了更好的理解本专利技术,将对以下本专利技术的详细描述进行参考,本专利技术详细描述将参照附图而被阅读,其中图1举例说明了其中运行本专利技术的环境的一个实施例;图2举例说明了配置作为集群成员的网络装置的一个实施例的功能框图;图3A-3B举例说明了通常展示集群建立过程的一个实施例的流程图;图4A-4E举例说明了通常展示集群主机(cluster master)管理集群成员的过程的一个实施例的流程图;以及图5根据本专利技术的一个实施例,举例说明了通常展示集群成员(客户端)管理与集群主机的连通性通信的过程的一个实施例的流程图。具体实施例方式现在将参考附图在下文中更加完整地描述本专利技术,其中由此形成本专利技术的一部分,并且其通过举例说明的方式展示了本专利技术可以通过其实现的特定示例性实施例。然而,本专利技术可以以很多不同形式实施,并不应当被认为是受限于此处阐明的实施例;而是,提供这些实施例以便本公开内容将彻底并完整,并且会对本领域的技术人员完全传达本专利技术的范围。其中,本专利技术可以作为方法或装置实施。因此,本专利技术可以采取完全是硬件的实施例,完全是软件的实施例或是组合了软件和硬件方面的实施例的形式。因此,以下详细描述并非出于限制的意思。术语“由...组成”、“包括”、“包含”、“具有”、以及“其特征在于”是指可扩充的或包括在内的开放式结构,并不排除其它的、未列举的元素或方法步骤。例如,包含元素A和B的组合也理解为元素A、B和C元素的组合。“一个”和“这个”的含义包括复数引用。“在...之内”的含义包括“在...之内”和“在...之上”。此外,除非另外声明或与此处的公开不一致,对单数的引用包括对复数的引用。除非上下文明确做出另外的指示,术语“或”是包含性的“或”操作符,并且包括术语“和/或”。如此处所用的短语“在一个实施例中”尽管可能,但不必要代指同一个实施例。与之类似,如此处所用的短语“在另一个实施例中”尽管可能,但也不必要代指不同的实施例。除非上下文明确做出另外的指示,术语“基于”不是排除性的,并且规定基于未叙述的附加要素。术语“分组”包括IP(网际协议)分组。简言之,本专利技术致力于在诸如局域网(LAN)交换机、集线器、以及类似的网络接口或网络设备部分故障之后,用于最大化集群的网络连通性的系统、设备和方法。集群中指定为集群主机的网络装置配置用于部分基于集群成员的连通性确定集群成员资格。另一网络装置配置用于交换有关其到集群主机的连通性的信息。集群主机比较所接收的信息以确定该网络装置是否具有与该集群不同的连通性。如果该网络装置具有不同的连通性,集群主机就可以拒绝给予该网络装置的集群成员资格。通过拒绝具有不同连通性的网络装置,本专利技术确保由该集群接收的数据可以通过实际上任何该集群的成员以基本上相等的可靠性发送。这样,如果集群成员丧失对网络的连通性,并且至少一个集群成员仍旧保持对该网络的连通性,那么集群主机就可以迫使出了故障的成员离开该集群。如果正离开的集群成员的连通性随后又恢复了,或者如果所有的集群成员随后都失去了对该网络的连通性等,那么该集群成员可重新加入该集群。如果集群主机自身失去对网络的连通性,它可以离开该集群,并且具有最大连通性的集群成员的集合可以利用新的集群主机重新组成新的集群。此外,如果所有的集群成员都失去了对同一网络的连通性,集群成员资格可以保持不变,而集群成员可以继续提供到剩余网络的连通性。这种方法于是确保该集群系统包含具有对相邻网络的最大连通性的成员。示例操作环境图1举例说明了其中运行本专利技术的环境的一个实施例。不必要求所有的组件以实现本专利技术,而是可以不偏离本专利技术的构思或范围进行布置和组件类型的变更。如图中所示,集群系统100包括局域网/广域网(LAN/WAN)106和107以及集群101。集群101包括集群成员102-105。集群101与LAN/WAN 106和107通信。集群成员102-105可以通过多个网络与LAN/WAN 106和107通信。例如,尽管未示例出,集群成员102-105与LAN/WAN 107之间可以存在多个网络连接。多个网络连接还可以进一步存在于集群成员102-105与LAN/WAN 106之间。然而,为了清楚起见,在图1中仅示例了协议网络108。协议网络108实际上包括应用于集群协议消息交换,包括其互连以及类似连接的任何网络。协议网络108可以基于机制的变化而选择,包括但不限于将网络预先配置为协议网络。协议网络108还可以基于包括服务质量、吞吐量、稳定性、速度等特征的任何变化而动态选择。此外,每个集群成员102-105都可以选择与其它集群成员102-105不同的协议网络108。集群101典型地被配置为包括松散耦合的网络装置,该网络装置可以合作以给其它设备提供对服务、资源等的访问。在一个实施例中,集群101配置用于通过适应性地负载均衡集群成员102-105以优化消息吞吐量。集群成员102-105可以是任何能够通过集群架构中的网络发送和接收数据分组的网络装置。在一个实施例中,集群成员102-105配置用于运行作为所接收消息分组的协议栈处理器。这种装置的集合可以包括典型地利用有线通信媒体连接的装置,诸如配置以运行作为集群装置的个人计算机、多处理器系统、基于微处理器的或可编程的用户电子产品、网络设备、网络PC、服务器等类似装置。这种装置的集合还可以包括典型地利用无线通信媒体连接的装置,诸如配置作为集群装置的蜂窝电话、智能电话、寻呼机、步话机、射频(RF)装置、红本文档来自技高网...

【技术保护点】
一种用于管理集群系统中的网络故障的网络装置,包括:用于发送和接收信息的收发信机;连接到所述收发信机、并被配置用于执行各种动作的处理器,这些动作包括:接收与其他网络装置有关的连通性信息;并且如果所述接收的连通性信息基本上不同于与所述集群系统相关的连通性信息集合,则拒绝给予所述其他网络装置集群成员资格。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:彼得F亨特阿南德萨布瑞曼尼安
申请(专利权)人:诺基亚公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1