当前位置: 首页 > 专利查询>诺基亚公司专利>正文

用于管理集群系统中的协议网络故障的系统和方法技术方案

技术编号:3547254 阅读:159 留言:0更新日期:2012-04-11 18:40
方法和系统指向管理网络集群系统内的协议网络故障。所述集群内的集群主控和每个集群成员被配置为确定用于切换集群协议消息的主协议网络、次协议网络等。所述集群内的每个客户机成员在加入所述集群时,从至少所述主协议网络和所述次协议网络中确定其“有效协议网络”。每个客户机成员通过所述主协议网络尝试其到所述集群主控的连接。如果客户机成员在所述主协议网络上检测到故障,则其并不离开所述集群,动态地故障移转到所述次协议网络。如果恢复连接到所述主协议网络,则所述客户机成员并不离开所述集群,在所述主协议网络上重新开始所述协议消息切换。

【技术实现步骤摘要】
用于管理集群系统中的协议网络故障的系统和方法
本专利技术涉及计算系统,尤其涉及一种用于管理网络集群系统中的协议网络故障的系统和方法。
技术介绍
互联网已经发展成为许多公司依赖其作为商业活动的资源的普遍存在网络。例如,许多行业可使用互联网和类似的连网基础设施,以管理关键应用、接入内容服务器、自动化装配和生产线以及实施复合控制系统。商业的所述依赖已产生对于网络资源的更高保护和可用性保证的需要。响应于对于提供系统资源的高度可用性和免于故障的连网基础设施的需要,研发了集群体系结构。集群可被定义为多个合作以经由网络为客户机设备提供接入到一组业务、资源等的松散耦合的网络设备。所述集群内的成员可用于增加所述接入的可靠性和可用性。许多集群体系结构依赖于经由所述网络切换集群协议消息。所述集群可能使用所述消息来管理集群成员资格、指配工作和检测成员故障。所述集群可能规定连接到哪个网络来切换所述协议消息。然而,所规定网络及其相关连接和互连是所述集群的潜在故障点。如果集群成员失去了到所述网络的连接性,则其无法参与协议,且通常必须离开所述集群。这可能会导致无效功,以及降级的全面性能、接入和集群可靠性。此外,如果由于开关、集线器等发生故障而导致网络故障,则整个集群故障,而所有通过所述集群的连接丢失。因此,行业内存在对于高度可靠的集群基础设施的需要。因此,基于以上考虑构思了本专利技术。-->附图说明参照附图描述了本专利技术的非限制性和非穷举实施例。在附图中,除非特别说明,在各个图中相同附图标记表示相同部分。为更好地理解本专利技术,以下将参考结合附图所述的本专利技术具体实施方式,在附图中:图1示出了其内本专利技术操作的环境的一个实施例;图2示出了被配置为集群成员的网络设备的一个实施例的功能框图;图3示出了通常显示网络设备加入和离开所述集群的过程的一个实施例的流程图;图4A-4D示出了通常显示集群主控管理集群成员(客户机)协议网络通信的过程的一个实施例的流程图;以及图5A-5D示出了根据本专利技术一个实施例的流程图,其通常显示集群成员(客户机)管理与所述集群主控的协议网络通信的过程的一个实施例。具体实施方式以下将参照附图更为完全描述本专利技术,所述附图形成了本专利技术一部分,并借助描述示出了可借助其实践本专利技术的特定示范性实施例。然而,本专利技术可体现为许多不同形式,并且不应当构成对于本文所述实施例的限制;相反,提供所述实施例,从而使得本公开将会彻底和完全,并将本专利技术范围完全传递给本领域技术人员。除此之外,本专利技术可能还体现为方法或设备。因此,本专利技术可能采取完全硬件实施方式、完全软件实施方式或组合软件和硬件的实施方式的形式。因而以下详细描述将不具限制意义。术语“包括”、“包含”、“含有”、“具有”和“特征在于”指示开方式或包括常规构造,并不排除附加、未提及单元或方法步骤。例如,包括A和B单元的组合同样可理解为A、B和C单元的组合。-->意义“一个”包括多个参考。意义“内”包括“内”和“上”。此外,参考单个包括参考多个,除非特别说明或与本文公开不一致。术语“或者”包括“或者”算符,包括术语“和/或”,除非上下文明确说明。本文所使用的短语“在一个实施例内”并非必然是指相同实施例,尽管可能是。术语“基于”并非排他,并提供了基于未提及的附加因素,除非上下文明确说明。术语“分组”包括IP(互联网协议)分组。简而言之,本专利技术指向一种用于管理网络集群系统内的协议网络故障的系统和方法。本专利技术包括所述集群的集群主控和客户机成员,它们被配置为确定用于切换集群协议消息的至少一个主协议网络和次协议网络。所述集群内的每个客户机成员在加入所述集群时,确定是将所述主协议网络还是所述次协议网络用作其“有效”协议网络。如果客户机成员在所述主协议网络上检测到故障,则其可能在并不离开所述集群的情况下故障移转到所述次协议网络。如果到所述主协议网络的连接恢复,则所述客户机成员并不离开所述集群,动态恢复所述主协议网络上的协议消息切换。示范操作环境图1示出了其中本专利技术操作的环境的一个实施例。可能并不需要所有组件来实践本专利技术,且可在并不背离本专利技术的精神或范围的情况下,对布置和组件类型做出改变。如图所示,集群系统100包括局域网/广域网(LAN/WAN)106和107,以及集群101。集群101包括集群成员102-105。集群101与LAN/WAN 106和107通信。集群成员102-105可能通过多个网络与LAN/WAN 106和107通信。例如,尽管并未示出,但多个网络连接可能存在于集群成员102-105与LAN/WAN 106和107之间。然而,为清晰起见,图1仅示出了网-->络108和110。在一个实施例中,网络108是主协议网络,而网络110是次协议网络。协议网络实际上包括任何网络,包括用于切换集群协议消息的互连等。可能会基于各种机制选择所述协议网络,所述机制包括将网络预先配置为主协议网络,而将另一网络预先配置为次协议网络,但并不仅限于此。还可能基于多个特征动态选择协议网络,所述特征包括业务质量、吞吐量、稳定性、速度等。此外,如下所述,每个成员102-105可能会选择彼此不同的主和/或次协议网络。集群101通常被配置为包括合作以为另一设备提供接入到业务、资源等的松散耦合的网络设备。在一个实施例中,集群101被配置为通过自适应负载平衡集群成员102-105来最优化消息吞吐量。集群成员102-105可能是任何能够经由集群体系结构的网络发送和接收分组的网络设备。在一个实施例中,集群成员102-105被配置为作为所接收消息分组的协议栈处理器操作。所述设备组可能包括通常使用有线通信媒介连接的设备,例如个人计算机、多处理器系统、基于微处理器或可编程的客户电路、网络PC等,它们被配置为作为集群设备操作。所述设备组可能还包括通常使用无线通信媒介连接的设备,例如蜂窝电话、智能电话、寻呼机、步谈机、射频(RF)设备、红外线(IR)设备、CB、组合以上一个或多个设备的集成设备等,它们被配置为作为集群设备操作。作为选择,集群成员102-105可能是任何能够使用有线或无线通信媒介连接的设备,例如PDA、POCKETPC、耐磨计算机,或其它任何被配置为经由有线和/或无线通信媒介通信的设备,它们作为集群设备操作。集群成员102-105中的一个成员可能被配置为作为集群主控操作,而剩余的集群成员103-105可能被配置为作为客户机集群成员操作。然而,在并不背离本专利技术范围的情况下,客户机101并非受此限制,而集群成员103-105内的另一成员可能被配置为作为后备集群主控操作。当形成所述集群时并随后在集群主控故障之后,集群成员102-105可能还会动态地将一个成员选为集群主控。以下将结合图2更为详细描述集群成员102-105的一个实施例。-->LAN/WAN 106和107能够将任何形式的计算机可读媒体用于将信息从一个电子设备通信到另一电子设备。此外,LAN/WAN 106和107可包括互联网、局域网(LAN)、广域网(WAN)、例如通过通用串行总线(USB)端口的直接连接、其它形式的计算机可读媒体及其任何组合。在包括那些基于不同体系结构和协议的网络的一组互连LAN上,路由器充当LAN之间的能够将消息从一个LAN发送本文档来自技高网...

【技术保护点】
一种用于管理集群系统中的故障的网络设备,包括:收发信机,被设置为经由网络发送和接收分组;处理器,耦合到所述收发信机,被配置为执行多个动作,这些动作包括:确定有效协议网络,其中所述有效协议网络是从主协议网络和次协议网络中的至少一个选择的;以及 如果在所述有效协议网络中检测到故障,则将所述有效协议网络切换到另一协议网络,而无需离开所述集群系统。

【技术特征摘要】
US 2003-12-23 10/747,0171、一种用于管理集群系统中的故障的网络设备,包括:收发信机,被设置为经由网络发送和接收分组;处理器,耦合到所述收发信机,被配置为执行多个动作,这些动作包括:确定有效协议网络,其中所述有效协议网络是从主协议网络和次协议网络中的至少一个选择的;以及如果在所述有效协议网络中检测到故障,则将所述有效协议网络切换到另一协议网络,而无需离开所述集群系统。2、根据权利要求1的网络设备,其中所述有效协议网络还从第三协议网络中选择。3、根据权利要求1的网络设备,其中确定所述有效协议网络还包括:至少在所述主协议网络和所述次协议网络上发送消息。4、根据权利要求1的网络设备,其中所述网络设备还被配置成经由所述主协议网络和所述次协议网络中的至少一个,将协议消息发送到另一网络设备,其中所述协议消息用于指示所述主协议网络和所述次协议网络中的至少一个是活跃的。5、根据权利要求1的网络设备,其中确定所述有效协议网络还包括:如果所述主协议网络可用,则将所述主协议网络选为所述有效协议网络。6、根据权利要求1的网络设备,其中确定所述有效协议网络还包括:在所述主协议网络上发送消息;以及如果在所述主协议网络上接收到指示可以加入所述集群系统的响应,则将所述网络设备指定为集群成员,并将所述主协议网络识别为所述有效协议网络。7、根据权利要求6的网络设备,其中确定所述有效协议网络还包括:如果在所述主协议网络上未得到指示可以加入所述集群系统的响应,则在所述次协议网络上发送另一消息;以及如果在所述次协议网络上接收到指示可以加入所述集群系统的响应,则将所述网络设备指定为集群成员,并将所述次协议网络识别为所述有效协议网络。8、根据权利要求1的网络设备,其中检测所述有效协议网络中的故障还包括:在预定时间周期之后,无法在所述有效协议网络上接收来自集群主控的消息。9、一种用于管理集群系统中的故障的方法,包括:确定有效协议网络,其中从多个协议网络中的至少一个选择所述有效协议网络;以及如果在所述有效协议网络中检测到故障,则将所述有效协议网络切换到另一协议网络,而无需离开所述集群系统,其中从所述多个协议网络中的可用协议网络中选择所述另一协议网络。10、根据权利要求9的方法,还包括部分地基于预定网络和与网络相关的特征中的至少一个,在所述多个协议网络中指定...

【专利技术属性】
技术研发人员:皮特弗瑞德瑞克亨特阿南德萨布瑞曼尼安
申请(专利权)人:诺基亚公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1