一种集群系统的容灾方法和装置制造方法及图纸

技术编号:11376353 阅读:54 留言:0更新日期:2015-04-30 16:27
本发明专利技术实施例提供了一种集群系统的容灾方法和装置,其中的方法具体包括:获取各集群节点的运行过程信息;其中,所述运行过程信息包括:可访问性信息和/或负载信息和/或操作执行信息;以及当所述集群节点的可访问性信息和/或负载信息和/或操作执行信息符合预置容灾条件时,对集群系统进行容灾处理。本发明专利技术实施例能够实时保证整个集群系统的可靠性。

【技术实现步骤摘要】
一种集群系统的容灾方法和装置
本专利技术涉及计算机集群
,特别是涉及一种集群系统的容灾方法和装置。
技术介绍
计算机集群可以利用多个集群节点并行计算从而获得很高的计算速度,也可以用多个集群节点做备份,从而使得任何一台设备故障后整个集群系统还能正常运行。集群系统的可靠性是指集群系统对不论在何种情况下对请求的响应能力,也即,当集群系统中任何一台机器或者任何一个集群节点发生故障时集群系统能够通过剩下的机器和集群节点继续运行,这对集群系统的容灾能力提出了较高的要求。目前,集群系统的可靠性往往通过业务层来实现。以CDN(内容分发网络,ContentDeliveryNetwork)业务系统为例,其通常部署有多级存储服务器,多级存储服务器上存储有相同的内容,这样,在当前级存储服务器发生故障时,可以向上一级存储服务器请求内容等等。然而,对于集群系统内部的容灾尚无成型的方案。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种集群系统的容灾方法和装置。依据本专利技术的一个方面,提供了一种集群系统的容灾方法,包括:获取各集群节点的运行过程信息;其中,所述运行过程信息包括:可访问性信息和/或负载信息和/或操作执行信息;以及当所述集群节点的可访问性信息和/或负载信息和/或操作执行信息符合预置容灾条件时,对集群系统进行容灾处理。可选地,所述获取各集群节点的运行过程信息的步骤,包括:从集群节点获取其自身的可访问性信息和/或负载信息和/或操作执行信息;和/或从客户端获取其所访问集群节点的操作执行信息。可选地,所述操作执行信息包括操作出错信息和/或预置时间段内的操作执行信息;则所述从客户端获取其所访问集群节点的操作执行信息的步骤,包括:从客户端实时获取其所访问集群节点的操作出错信息;和/或从客户端定期获取其所访问集群节点在预置时间段内的操作执行信息。可选地,所述当所述集群节点的可访问性信息符合预置容灾条件时,对集群系统进行容灾处理的步骤,包括:在当前集群节点的可访问性信息为否时,向客户端发送第一节点切换信息;其中,所述第一节点切换信息用于指示客户端访问除当前集群节点外的其它集群节点;和/或在当前集群内可访问性信息为否的集群节点比例超过预置比例时,向客户端发送第一集群切换信息;其中,所述第一集群切换信息用于指示客户端访问除当前集群外的其它集群。可选地,所述当所述集群节点的负载信息符合预置容灾条件时,对集群系统进行容灾处理的步骤,包括:在当前集群节点的负载信息超过第一负载阈值时,向客户端发送第二节点切换信息;其中,所述第二节点切换信息用于指示客户端将部分或全部请求切换至除当前集群节点外的其它集群节点;和/或在当前集群的负载信息超过第二负载阈值时,向客户端发送第二集群切换信息;其中,所述第二集群切换信息用于指示客户端将部分或全部请求切换至除当前集群外的其它集群。可选地,所述当所述集群节点的操作执行信息符合预置容灾条件时,对集群系统进行容灾处理的步骤,包括:当所述集群节点在预置时间段内的操作执行信息符合第一容灾条件时,向客户端发送第三节点切换信息;其中,所述第三节点切换信息用于指示客户端将部分请求切换至除当前集群节点外的其它集群节点;和/或根据所述操作出错信息定位所述集群节点的故障,当所述故障对应故障等级高于预置故障等级时,向客户端发送第四节点切换信息;其中,所述第四节点切换信息用于指示客户端将部分或全部请求切换至除当前集群节点外的其它集群节点。根据本专利技术的另一方面,提供了一种集群系统的容灾装置,包括:信息获取模块,用于获取各集群节点的运行过程信息;其中,所述运行过程信息包括:可访问性信息和/或负载信息和/或操作执行信息;以及容灾处理模块,用于当所述集群节点的可访问性信息和/或负载信息和/或操作执行信息符合预置容灾条件时,对集群系统进行容灾处理。可选地,所述信息获取模块,包括:节点获取子模块,用于从集群节点获取其自身的可访问性信息和/或负载信息和/或操作执行信息;和/或客户端获取子模块,用于从客户端获取其所访问集群节点的操作执行信息。可选地,所述操作执行信息包括操作出错信息和/或预置时间段内的操作执行信息;则所述客户端获取子模块,包括:实时获取单元,用于从客户端实时获取其所访问集群节点的操作出错信息;和/或定期获取单元,用于从客户端定期获取其所访问集群节点在预置时间段内的操作执行信息。可选地,所述容灾处理模块,包括:第一容灾处理子模块,用于在当前集群节点的可访问性信息为否时,向客户端发送第一节点切换信息;其中,所述第一节点切换信息用于指示客户端访问除当前集群节点外的其它集群节点;和/或第二容灾处理子模块,用于在当前集群内可访问性信息为否的集群节点比例超过预置比例时,向客户端发送第一集群切换信息;其中,所述第一集群切换信息用于指示客户端访问除当前集群外的其它集群。根据本专利技术实施例的一种集群系统的容灾方法和装置,可以获取各集群节点的运行过程信息,其中,所述运行过程信息具体可以包括:可访问性信息和/或负载信息和/或操作执行信息,并在所述集群节点的可访问性信息和/或负载信息和/或操作执行信息符合预置容灾条件时,对集群系统进行容灾处理;由于上述运行过程信息能够实时反映集群节点的运行情况,例如,可访问性信息能够实时反映集群节点是否可访问,负载信息能够实时反映集群节点是否过载,操作执行信息能够反映集群节点对于操作的出错率或者准确率等等,故本专利技术实施例在所述集群节点的可访问性信息和/或负载信息和/或操作执行信息符合预置容灾条件时,对集群系统进行容灾处理,能够实时保证整个集群系统的可靠性;例如,可以在某个集群的流量突增时将部分流量切换至其它集群以起到过载保护,又如,可以在某个集群的多数集群节点不可用时可以将客户端的请求切换到其它集群以保证集群系统的响应能力;再如,在基于集群节点的操作出错信息定位的故障等级高于预置故障等级时,则可以认为该集群节点提供的一个操作或所有操作的服务不可用,故可以将客户端的部分或全部请求切换至除当前集群节点外的其它集群节点,等等。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文可选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出可选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了根据本专利技术一个实施例的一种集群系统的容灾方法的步骤流程示意图;图2示出了根据本专利技术一个实施例的一种集群系统的结构示意图;图3示出了根据本专利技术一个实施例的一种集群系统的容灾方法的步骤流程示意图;图4示出了根据本专利技术一个实施例的一种集群系统的容灾方法的步骤流程示意图;图5示出了根据本专利技术一个实施例的一种集群系统的容灾方法的步骤流程示意图;图6示出了根据本专利技术一个实施例的一种集群系统的容灾方法的步骤流程示意图;以及图7示出了根据本专利技术一个实施例的一种集群系统的容灾装置的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附本文档来自技高网...

【技术保护点】
一种集群系统的容灾方法,包括:获取各集群节点的运行过程信息;其中,所述运行过程信息包括:可访问性信息和/或负载信息和/或操作执行信息;以及当所述集群节点的可访问性信息和/或负载信息和/或操作执行信息符合预置容灾条件时,对集群系统进行容灾处理。

【技术特征摘要】
1.一种集群系统的容灾方法,包括:获取各集群节点的运行过程信息;其中,所述运行过程信息包括:可访问性信息和/或负载信息和/或操作执行信息;所述操作执行信息包括操作出错信息;以及当所述集群节点的可访问性信息和/或负载信息和/或操作执行信息符合预置容灾条件时,对集群系统进行容灾处理;所述当所述集群节点的操作执行信息符合预置容灾条件时,对集群系统进行容灾处理,包括:根据所述操作出错信息定位所述集群节点的故障,当所述故障对应故障等级高于预置故障等级时,向客户端发送第四节点切换信息;其中,所述第四节点切换信息用于指示客户端将部分或全部请求切换至除当前集群节点外的其它集群节点;所述当所述集群节点的可访问性信息符合预置容灾条件时,对集群系统进行容灾处理的步骤,还包括:在当前集群节点的可访问性信息为否时,向客户端发送第一节点切换信息;其中,所述第一节点切换信息用于指示客户端访问除当前集群节点外的其它集群节点;和/或在当前集群内可访问性信息为否的集群节点比例超过预置比例时,向客户端发送第一集群切换信息;其中,所述第一集群切换信息用于指示客户端访问除当前集群外的其它集群;所述可访问信息包括:存活状态信息。2.如权利要求1所述的方法,其特征在于,所述获取各集群节点的运行过程信息的步骤,包括:从集群节点获取其自身的可访问性信息和/或负载信息和/或操作执行信息;和/或从客户端获取其所访问集群节点的操作执行信息。3.如权利要求2所述的方法,其特征在于,所述操作执行信息还包括预置时间段内的操作执行信息;则所述从客户端获取其所访问集群节点的操作执行信息的步骤,包括:从客户端实时获取其所访问集群节点的操作出错信息;和/或从客户端定期获取其所访问集群节点在预置时间段内的操作执行信息。4.如权利要求1或2或3所述的方法,其特征在于,所述当所述集群节点的负载信息符合预置容灾条件时,对集群系统进行容灾处理的步骤,包括:在当前集群节点的负载信息超过第一负载阈值时,向客户端发送第二节点切换信息;其中,所述第二节点切换信息用于指示客户端将部分或全部请求切换至除当前集群节点外的其它集群节点;和/或在当前集群的负载信息超过第二负载阈值时,向客户端发送第二集群切换信息;其中,所述第二集群切换信息用于指示客户端将部分或全部请求切换至除当前集群外的其它集群。5.如权利要求3所述的方法,其特征在于,所述当所述集群节点的操作执行信息符合预置容灾条件时,对集群系统进行容灾处理的步骤,还包括:当所述集群节点在预置时间段内的操作执行信息符合第一容灾条件时,向客户端发送第三节点切换信息;其中,所述第三节点切换信息用于指示客户端将部分请...

【专利技术属性】
技术研发人员:陈营李明昊宋昭陈宗志王超
申请(专利权)人:北京奇虎科技有限公司奇智软件北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1