共享磁盘故障节点的处理方法、装置、计算机设备制造方法及图纸

技术编号:20566514 阅读:45 留言:0更新日期:2019-03-14 09:21
本发明专利技术公开了共享磁盘故障节点的处理方法,属于计算机技术领域。所述方法包括:接收正常节点发送的故障节点修复命令;根据所述故障节点修复命令,判断所述故障节点是否为当前节点;当所述故障节点为当前节点时,对所述当前节点进行故障修复;其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。采用本方法能够降低处理节点故障的成本、提高故障处理想效率。

Processing Method, Device and Computer Equipment of Fault Node of Shared Disk

The invention discloses a method for processing shared disk fault nodes, which belongs to the field of computer technology. The method includes: receiving the repair command of the fault node sent by the normal node; judging whether the fault node is the current node according to the repair command of the fault node; repairing the current node when the fault node is the current node; where each node corresponds to a shared disk partition, the shared disk partition includes a shared magnet. The disk head, node identification area, command area and node information area are stored in the command area after the current node receives the repair command of the fault node. This method can reduce the cost of dealing with node failures and improve the efficiency of fault treatment.

【技术实现步骤摘要】
共享磁盘故障节点的处理方法、装置、计算机设备
本专利技术涉及计算机
,并且更具体地,涉及一种共享磁盘故障节点的处理方法、装置、计算机设备。
技术介绍
在高可用集群中,通过节点的心跳网络连接状况判断节点是否活跃,当节点的心跳网络出现故障,运行在生产节点的服务可迁移到其它健康节点,以保证高可用集群能够对外提供不间断的可用服务,生产节点为正在提供服务的节点。当高可用集群中各节点心跳网络正常,生产节点由于某种程序故障或恶意插件导致内存或CPU耗尽,由于SSH(SecureShell,安全外壳)协议不能登录到产生故障的生产节点,因此不能根据集群的策略引擎发出的服务迁移指令将服务可迁移到其它健康节点,导致服务滞留在内存耗尽的生产节点上,最终导致高可用集群对外提供的服务瘫痪。现有使用串行或者基于网络的电源切换设备作为fencing资源,添加到高可用集群中。这种设备采用stonithd机制,stonith的意思是"ShoottheOtherNodeintheHead",主要是使出现问题的节点从集群环境中脱离,即对出现问题的节点关机或重启。当现有方法存在如下问题:向高可用集群中添加额外的fencing设备,来保证高可用集群的不间断服务,由于这种设备价格昂贵,并不适合中小企业。同时,生产环境中出现生产节点出现故障问题必须及时解决以恢复集群正常服务,如果通过购买设备来解决所述问题,导致问题解决不及时,会造成巨大损失。
技术实现思路
基于此,未解决上述问题,提供一种能够降低故障节点处理成本和提高故障处理效率的共享磁盘故障节点的处理方法、装置、计算机设备。一种共享磁盘故障节点的处理方法,所述方法包括:接收正常节点发送的故障节点修复命令;根据所述故障节点修复命令,判断所述故障节点是否为当前节点;当所述故障节点为当前节点时,对所述当前节点进行故障修复;其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。在其中一个实施例中,所述方法还包括:当所述故障节点不为当前节点时,判断所述故障节点是否存在于集群中;当所述故障节点存在于集群中时,则将所述故障节点修复命令发送至所述故障节点;当所述故障节点不存在于集群中时,删除所述故障节点修复命令;其中,所述集群包括多个节点,集群中各个节点之间相互连接,集群各个节点通过主控节点进行任务调度。在其中一个实施例中,所述故障节点修复命令包括命令发送节点标识、故障修复命令和命令接收节点标识。在其中一个实施例中,所述根据所述故障节点修复命令,判断所述故障节点是否为当前节点,包括:根据所述故障节点修复命令中所述命令接收节点标识,判断所述命令接收节点标识与当前节点标识是否相同;如果所述命令接收节点标识与当前节点标识相同,则判断所述故障节点为当前节点,否则判断所述故障节点不为当前节点。在其中一个实施例中,所述故障修复包括关闭或重启所述当前节点。一种共享磁盘故障节点的获取方法,所述方法包括:将当前节点的共享磁盘分区配置信息发送至集群;初始化所述共享磁盘分区;启动守护进程,通过所述共享磁盘分区获取所述集群中其它节点信息;根据所述节点信息,获取故障节点并发送故障节点修复命令;其中,所述集群包括多个节点,集群中各个节点之间相互通信连接,集群各个节点通过主控节点进行任务调度。在其中一个实施例中,所述初始化所述共享磁盘分区之后,包括:当启动守护进程从所述共享磁盘分区获取到所述集群中其它节点信息时,则向集群中的其它相关进程发送所述共享磁盘分区初始化成功消息;当启动守护进程不能从所述共享磁盘分区获取所述集群中其它节点信息时,则向集群中的其它相关进程发送所述共享磁盘分区初始化失败消息。一种共享磁盘故障节点的处理装置,所述装置包括:命令接收模块,用于接收正常节点发送的故障节点修复命令;判断模块,用于根据所述故障节点修复命令,判断所述故障节点是否为当前节点;故障修复模块,用于当所述故障节点为当前节点时,对所述当前节点进行故障修复;其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:接收正常节点发送的故障节点修复命令;根据所述故障节点修复命令,判断所述故障节点是否为当前节点;当所述故障节点为当前节点时,对所述当前节点进行故障修复;其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:接收正常节点发送的故障节点修复命令;根据所述故障节点修复命令,判断所述故障节点是否为当前节点;当所述故障节点为当前节点时,对所述当前节点进行故障修复;其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。上述共享磁盘故障节点的处理方法、装置、计算机设备,通过对每个节点建立共享磁盘分区,再通过正常节点向故障节点发送故障修复命令,以实现对故障的有效处理,从而避免通过外部的fencing设备来处理故障,能够降低节点故障的处理成本,提供故障的处理效率。附图说明通过参考下面的附图,可以更为完整地理解本专利技术的示例性实施方式:图1为一个实施例中共享磁盘故障节点的处理方法的流程示意图;图2为一个实施例中故障节点修复命令转发步骤的流程示意图;图3为一个实施例中共享磁盘分区的组成示意图;图4为一个实施例中共享磁盘故障节点的获取方法的流程示意图;图5为一个实施例中共享磁盘故障节点的处理装置的结构框图;图6为一个实施例中计算机设备的内部结构图。具体实施方式现在参考附图介绍本专利技术的示例性实施方式,然而,本专利技术可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本专利技术,并且向所属
的技术人员充分传达本专利技术的范围。对于表示在附图中的示例性实施方式中的术语并不是对本专利技术的限定。在附图中,相同的单元/元件使用相同的附图标记。除非另有说明,此处使用的术语(包括科技术语)对所属
的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。在一个实施例中,如图1所示,提供一种共享磁盘故障节点的处理方法,所述方法包括步骤:步骤S110,接收正常节点发送的故障节点修复命令。其中,所述故障节点修复命令包括命令发送节点标识、故障修复命令和命令接收节点标识。所述命令发送节点标识用于保存命令发送节点的地址信息,所述命令接收节点标识用于保存命令接收节点的地址信息。步骤S120,根据所述故障节点修复命令,判断所述故障节点是否为当前节点。步骤S130,当所述故障节点为当前节点时,对所述当前节点进行故障修复。其中,每个所述节点对本文档来自技高网
...

【技术保护点】
1.一种共享磁盘故障节点的处理方法,其特征在于,所述方法包括:接收正常节点发送的故障节点修复命令;根据所述故障节点修复命令,判断所述故障节点是否为当前节点;当所述故障节点为当前节点时,对所述当前节点进行故障修复;其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。

【技术特征摘要】
1.一种共享磁盘故障节点的处理方法,其特征在于,所述方法包括:接收正常节点发送的故障节点修复命令;根据所述故障节点修复命令,判断所述故障节点是否为当前节点;当所述故障节点为当前节点时,对所述当前节点进行故障修复;其中,每个所述节点对应于一个共享磁盘分区,所述共享磁盘分区包括共享磁盘头、节点标识区、命令区和节点信息区,所述当前节点接收所述故障节点修复命令后存储于所述命令区。2.根据权利要求1所述的方法,其特征在于,还包括:当所述故障节点不为当前节点时,判断所述故障节点是否存在于集群中;当所述故障节点存在于集群中时,则将所述故障节点修复命令发送至所述故障节点;当所述故障节点不存在于集群中时,删除所述故障节点修复命令;其中,所述集群包括多个节点,集群中各个节点之间相互连接,集群各个节点通过主控节点进行任务调度。3.根据权利要求1所述的方法,其特征在于,所述故障节点修复命令包括命令发送节点标识、故障修复命令和命令接收节点标识。4.根据权利要求3所述的方法,其特征在于,所述根据所述故障节点修复命令,判断所述故障节点是否为当前节点,包括:根据所述故障节点修复命令中所述命令接收节点标识,判断所述命令接收节点标识与当前节点标识是否相同;如果所述命令接收节点标识与当前节点标识相同,则判断所述故障节点为当前节点,否则判断所述故障节点不为当前节点。5.根据权利要求1所述的方法,其特征在于,所述故障修复包括关闭或重启所述当前节点。6.一种共享磁盘故障节点的获取方法,其特征在于,所述方法包括:将当前节点的共享磁...

【专利技术属性】
技术研发人员:盛凯博
申请(专利权)人:华迪计算机集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1