用于容错通信的系统和方法技术方案

技术编号:14687536 阅读:60 留言:0更新日期:2017-02-23 09:45
本发明专利技术揭示用于容许通信网格中的故障的设备、系统和方法。具体来说,提供各种技术和系统以用于在通信网格中检测计算机节点的网络中的节点的故障或失效;调整所述网格以避免网格失效;以及基于所述失效采取行动。在实例中,系统可包含在备份控制节点处接收网格状态信息,所述网格状态信息包含项目状态;将所述网格状态信息存储在所述备份控制节点内;接收包含主要控制节点已失效的指示的失效通信;将所述备份控制节点指定为新主要控制节点;基于所述主要控制节点已失效的所述指示而接收经更新的网格状态信息;以及基于所述经更新的网格状态信息而传输指令集。

【技术实现步骤摘要】
【国外来华专利技术】相关申请案的交叉参考此申请案为非临时的且依据35U.S.C.§119(e)要求标题为“分布式处理的容错通信策略(Fault-TolerantCommunicationStrategiesforDistributedProcessing)”的美国临时申请案第62/019,426号的益处和优先权。所述美国临时申请案申请于2014年7月1日且出于所有目的以引用的方式并入本文中。
本专利技术涉及用于容许通信网格中的错误的计算机技术。具体来说,提供各种技术和系统以用于检测通信网格中计算机节点的网络中的节点的错误或失效;调整所述网格以避免网格失效;以及基于所述失效采取行动。
技术介绍
在包含执行作业的计算机节点的网络的通信网格中,节点可失效。节点的失效可引起整个网格的失效,并且因此整个作业的失效,从而从起点重新开始作业。对于包含较大数据集或可能花费长时间段完成的作业,此失效可尤其难以解决。
技术实现思路
本专利技术涉及用于容许通信网格中的错误的计算机技术。具体来说,提供各种技术和系统以用于检测通信网格中计算机节点的网络中的节点的错误或失效;调整所述网格以避免网格失效;以及基于所述失效采取行动。在实施例中,计算机程序产品可有形地体现在非暂时性机器可读存储媒体中。非暂时性机器可读存储媒体可包含经配置以使得数据处理设备进行以下操作的指令:在通信网格上连接到主要控制节点和工作者节点的备份控制节点处接收网格状态信息,所述网格状态信息包含主要控制节点的项目状态或工作者节点的项目状态,其中主要控制节点的项目状态和工作者节点的项目状态包含正由通信网格中的主要节点和工作者节点执行的项目的一或多个部分的状态;将网格状态信息存储在备份控制节点内;接收包含主要控制节点已失效的指示的失效通信;在接收到失效通信时基于失效通信将备份控制节点指定为新主要控制节点;基于主要控制节点已失效的所述指示而接收经更新的网格状态信息,其中经更新的网格状态信息包含主要控制节点的经更新的项目状态或工作者节点的经更新的项目状态;以及基于经更新的网格状态信息传输指令集,其中指令集包含使工作者节点在主要控制节点的失效之后继续致力于所述项目的指令。在一个方面中,计算机程序产品可进一步包括经配置以使得数据处理设备在备份控制节点处接收包含备份控制节点为新主要控制节点的指示的主要节点通信的指令。在另一方面中,在接收到失效通信时,备份控制节点基于备份控制节点的唯一标识符或级别确定是否应将备份节点指定为新主要控制节点;和分配新主要控制节点。在另一方面中,在接收到失效通信时,备份控制节点确定备份控制节点为通信网格上的唯一备份控制节点。在另一方面中,主要控制节点控制每一工作者节点负责执行的项目的各部分。在另一方面中,给通信网格上的每一控制节点和工作者节点分配所存储的唯一标识符,其中节点的唯一标识符指示在通信网格内节点的层级,且其中每一控制节点和每一工作者节点存储通信网格上的所有其它控制节点和工作者节点的唯一标识符。在另一方面中,工作者节点的工作者节点执行项目的不同部分。在另一方面中,网格状态信息包含指示在主要控制节点的失效之前项目的进展阶段的项目检查点(或进展检查点)。在另一方面中,基于经更新的网格状态信息传输指令集包含传输来自项目检查点的指示在主要控制节点的失效之前所述项目的进展阶段的状态。在另一方面中,计算机程序产品可进一步包括经配置以使得数据处理设备进行以下操作的指令:确定主要控制节点已失效,其中确定主要控制节点已失效包含确定备份控制节点未接收到预期检测信号通信,其中检测信号通信指示主要控制节点为可操作的。在另一方面中,确定主要控制节点已失效包含确定备份控制节点在预定时间段之后未从主要控制节点接收到检测信号通信。在另一实施例中,计算装置可包括一或多个处理器,和上面存储有指令的存储器,所述指令由一或多个处理器执行。处理器可使得计算装置执行包含以下各者的操作:在通信网格上连接到主要控制节点和工作者节点的备份控制节点处接收网格状态信息,所述网格状态信息包含主要控制节点的项目状态或工作者节点的项目状态,其中主要控制节点的项目状态和工作者节点的项目状态包含正由通信网格中的主要节点和工作者节点执行的项目的一或多个部分的状态;将网格状态信息存储在备份控制节点内;接收包含主要控制节点已失效的指示的失效通信;在接收到失效通信时基于失效通信将备份控制节点指定为新主要控制节点;基于主要控制节点已失效的所述指示而接收经更新的网格状态信息,其中经更新的网格状态信息包含主要控制节点的经更新的项目状态或工作者节点的经更新的项目状态;以及基于经更新的网格状态信息传输指令集,其中所述指令集包含使工作者节点在主要控制节点失效之后继续致力于所述项目的指令。在一方面中,计算装置可进一步包括指令,所述指令在由一或多个处理器执行时使得计算装置执行包含以下各者的操作:在备份控制节点处接收包含备份控制节点为新主要控制节点的指示的主要节点通信。在另一方面中,在接收到失效通信时,备份控制节点基于备份控制节点的唯一标识符或级别确定是否应将备份节点指定为新主要控制节点;和分配新主要控制节点。在另一方面中,在接收到失效通信时,备份控制节点确定备份控制节点为通信网格上的唯一备份控制节点。在另一方面中,主要控制节点控制每一工作者节点负责执行的项目的各部分。在另一方面中,给通信网格上的每一控制节点和工作者节点分配所存储的唯一标识符,其中节点的唯一标识符指示在通信网格内节点的层级,且其中每一控制节点和每一工作者节点存储通信网格上的所有其它控制节点和工作者节点的唯一标识符。在另一方面中,工作者节点的工作者节点执行项目的不同部分。在另一方面中,网格状态信息包含指示在主要控制节点失效之前项目的进展阶段的项目检查点。在另一方面中,基于经更新的网格状态信息传输指令集包含传输来自项目检查点的指示在主要控制节点的失效之前所述项目的进展阶段的状态。在另一方面中,计算装置可进一步包括指令,所述指令在由一或多个处理器执行时使得计算装置执行包含以下各者的操作:确定主要控制节点已失效,其中确定主要控制节点已失效包含确定备份控制节点未接收到预期检测信号通信,其中检测信号通信指示主要控制节点为可操作的。在另一方面中,确定主要控制节点已失效包含确定备份控制节点在预定时间段之后未从主要控制节点接收到检测信号通信。在另一实施例中,计算机实施方法可包括:在通信网格上连接到主要控制节点和工作者节点的备份控制节点处接收网格状态信息,所述网格状态信息包含主要控制节点的项目状态或工作者节点的项目状态,其中主要控制节点的项目状态和工作者节点的项目状态包含正由通信网格中的主要节点和工作者节点执行的项目的一或多个部分的状态;将网格状态信息存储在备份控制节点内;接收包含主要控制节点已失效的指示的失效通信;在接收到失效通信时基于失效通信将备份控制节点指定为新主要控制节点;基于主要控制节点已失效的所述指示接收经更新的网格状态信息,其中经更新的网格状态信息包含主要控制节点的经更新的项目状态或工作者节点的经更新的项目状态;以及基于经更新的网格状态信息传输指令集,其中所述指令集包含使工作者节点在主要控制节点失效之后继续致力于所述项目的指令。在一方面中,所述方法可进一步包括在备份控制节点处接收包含备本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201580026917.html" title="用于容错通信的系统和方法原文来自X技术">用于容错通信的系统和方法</a>

【技术保护点】
一种有形地体现在非暂时性机器可读存储媒体中的计算机程序产品,其包含经配置以使得数据处理设备进行以下操作的指令:在通信网格上连接到主要控制节点和工作者节点的备份控制节点处接收网格状态信息,所述网格状态信息包含所述主要控制节点的项目状态或所述工作者节点的项目状态,其中所述主要控制节点的所述项目状态和所述工作者节点的所述项目状态包含正由所述通信网格中的所述主要节点和工作者节点执行的项目的一或多个部分的状态;将所述网格状态信息存储在所述备份控制节点内;接收包含所述主要控制节点已失效的指示的失效通信;在接收到所述失效通信时基于所述失效通信而将所述备份控制节点指定为新主要控制节点;基于所述主要控制节点已失效的所述指示而接收经更新的网格状态信息,其中所述经更新的网格状态信息包含所述主要控制节点的经更新的项目状态或所述工作者节点的经更新的项目状态;以及基于所述经更新的网格状态信息传输指令集,其中所述指令集包含使所述工作者节点在所述主要控制节点的失效之后继续致力于所述项目的指令。

【技术特征摘要】
【国外来华专利技术】2014.07.01 US 62/019,4261.一种有形地体现在非暂时性机器可读存储媒体中的计算机程序产品,其包含经配置以使得数据处理设备进行以下操作的指令:在通信网格上连接到主要控制节点和工作者节点的备份控制节点处接收网格状态信息,所述网格状态信息包含所述主要控制节点的项目状态或所述工作者节点的项目状态,其中所述主要控制节点的所述项目状态和所述工作者节点的所述项目状态包含正由所述通信网格中的所述主要节点和工作者节点执行的项目的一或多个部分的状态;将所述网格状态信息存储在所述备份控制节点内;接收包含所述主要控制节点已失效的指示的失效通信;在接收到所述失效通信时基于所述失效通信而将所述备份控制节点指定为新主要控制节点;基于所述主要控制节点已失效的所述指示而接收经更新的网格状态信息,其中所述经更新的网格状态信息包含所述主要控制节点的经更新的项目状态或所述工作者节点的经更新的项目状态;以及基于所述经更新的网格状态信息传输指令集,其中所述指令集包含使所述工作者节点在所述主要控制节点的失效之后继续致力于所述项目的指令。2.根据权利要求1所述的计算机程序产品,其进一步包括经配置以使得所述数据处理设备进行以下操作的指令:在所述备份控制节点处接收包含所述备份控制节点为所述新主要控制节点的指示的主要节点通信。3.根据权利要求1所述的计算机程序产品,其中在接收到所述失效通信时,所述备份控制节点基于所述备份控制节点的唯一标识符或级别确定是否应将所述备份节点指定为所述新主要控制节点,和分配新主要控制节点。4.根据权利要求1所述的计算机程序产品,其中在接收到所述失效通信时,所述备份控制节点确定所述备份控制节点为所述通信网格上的唯一备份控制节点。5.根据权利要求1所述的计算机程序产品,其中所述主要控制节点控制所述项目的每一工作者节点负责执行的所述部分。6.根据权利要求1所述的计算机程序产品,其中给所述通信网格上的每一控制节点和工作者节点分配所存储的唯一标识符,其中所述节点的所述唯一标识符指示所述通信网格内的所述节点的层级,且其中每一控制节点和每一工作者节点存储所述通信网格上的所有其它控制节点和工作者节点的所述唯一标识符。7.根据权利要求1所述的计算机程序产品,其中所述工作者节点中的工作者节点执行所述项目的不同部分。8.根据权利要求1所述的计算机程序产品,其中所述网格状态信息包含指示在所述主要控制节点的失效之前所述项目的进展阶段的项目检查点。9.根据权利要求8所述的计算机程序产品,其中基于所述经更新的网格状态信息传输所述指令集包含传输来自所述项目检查点的指示在所述主要控制节点的所述失效之前所述项目的所述进展阶段的状态。10.根据权利要求1所述的计算机程序产品,其进一步包括经配置以使得所述数据处理设备进行以下操作的指令:确定所述主要控制节点已失效,其中确定所述主要控制节点已失效包含确定所述备份控制节点未接收到预期检测信号通信,其中所述检测信号通信指示所述主要控制节点为可操作的。11.根据权利要求10所述的计算机程序产品,其中确定所述主要控制节点已失效包含确定所述备份控制节点在预定时间段之后未从所述主要控制节点接收到检测信号通信。12.一种计算装置,其包括:一或多个处理器;以及存储器,其上存储有指令,所述指令在由所述一或多个处理器执行时使得所述计算装置执行包含以下各者的操作:在通信网格上连接到主要控制节点和工作者节点的备份控制节点处接收网格状态信息,所述网格状态信息包含所述主要控制节点的项目状态或所述工作者节点的项目状态,其中所述主要控制节点的所述项目状态和所述工作者节点的所述项目状态包含正由所述通信网格中的所述主要节点和工作者节点执行的项目的一或多个部分的状态;将所述网格状态信息存储在所述备份控制节点内;接收包含所述主要控制节点已失效的指示的失效通信;在接收到所述失效通信时基于所述失效通信而将所述备份控制节点指定为新主要控制节点;基于所述主要控制节点已失效的所述指示而接收经更新的网格状态信息,其中所述经更新的网格状态信息包含所述主要控制节点的经更新的项目状态或所述工作者节点的经更新的项目状态;以及基于所述经更新的网格状态信息传输指令集,其中所述指令集包含使所述工作者节点在所述主要控制节点的失效之后继续致力于所述项目的指令。13.根据权利要求12所述的计算装置,其进一步包括指令,所述指令在由所述一或多个处理器执行时使得所述计算装置执行包含以下各者的操作:在所述备份控制节点处接收包含所述备份控制节点为所述新主要控制节点的指示的主要节点通信。14.根据权利要求12所述的计算装置,其中在接收到所述失效通信时,所述备份控制节点基于所述备份控制节点的唯一标识符或级别确定是否应将所述备份节点指定为所述新主要控制节点,和分配新主要控制节点。15.根据权利要求12所述的计算装置,其中在接收到所述失效通信时,所述备份控制节点确定所述备份控制节点为所述通信网格上的唯一备份控制节点。16.根据权利要求12所述的计算装置,其中所述主要控制节点控制所述项目的每一工作者节点负责执行的所述部分。17.根据权利要求12所述的计算装置,其中给所述通信网格上的每一控制节点和工作者节点分配所存储的唯一标识符,其中所述节点的所述唯一标识符指示所述通信网格内的所述节点的层级,且其中每一控制节点和每一工作者节点存储所述通信网格上的所有其它控制节点和工作者节点的所述唯一标识符。18.根据权利要求12所述的计算装置,其中所述工作者节点中的工作者节点执行所述项目的不同部分。19.根据权利要求12所述的计算装置,其中所述网格状态信息包含指示在所述主要控制节点的失效之前所述项目的进展阶段的项目检查点。20.根据权利要求19所述的计算装置,其中基于所述经更新的网格状态信息传输所述指令集包含传输来自所述项目检查点的指示在所述主要控制节点的所述失效之前所述项目的所述进展阶段的状态。21.根据权利要求12所述的计算装置,其进一步包括指令,所述指令在由所述一或多个处理器执行时使得所述计算装置执行包含以下各者的操作:确定所述主要控制节点已失效,其中确定所述主要控制节点已失效包含确定所述备份控制节点未接收到预期检测信号通信,其中所述检测信号通信指示所述主要控制节点为可操作的。22.根据权利要求21所述的计算装置,其中确定所述主要控制节点已失效包含确定所述备份控制节点在预定时间段之后未从所述主要控制节点接收到检测信号通信。23.一种计算机实施方法,其包括:在通信网格上连接到主要控制节点和工作者节点的备份控制节点处接收网格状态信息,所述网格状态信息包含所述主要控制节点的项目状态或所述工作者节点的项目状态,其中所述主要控制节点的所述项目状态和所述工作者节点的所述项目状态包含正由所述通信网格中的所述主要节点和工作者节点执行的项目的一或多个部分的状态;将所述网格状态信息存储在所述备份控制节点内;接收包含所述主要控制节点已失效的指示的失效通信;在接收到所述失效通信时基于所述失效通信而将所述备份控制节点指定为新主要控制节点;基于所述主要控制节点已失效的所述指示而接收经更新的网格状态信息,其中所述经更新的网格状态信息包含所述主要控制节点的经更新的项目状态或所述工作者节点的经更新的项目状态;以及基于所述经更新的网格状态信息传输指令集,其中所述指令集包含使所述工作者节点在所述主要控制节点的失效之后继续致力于所述项目的指令。24.根据权利要求23所述的方法,其进一步包括:在所述备份控制节点处接收包含所述备份控制节点为所述新主要控制节点的指示的主要节点通信。25.根据权利要求23所述的方法,其中在接收到所述失效通信时,所述备份控制节点基于所述备份控制节点的唯一标识符或级别确定是否应将所述备份节点指定为所述新主要控制节点;和分配新主要控制节点。26.根据权利要求23所述的方法,其中在接收到所述失效通信时,所述备份控制节点确定所述备份控制节点为所述通信网格上的唯一备份控制节点。27.根据权利要求23所述的方法,其中所述主要控制节点控制所述项目的每一工作者节点负责执行的所述部分。28.根据权利要求23所述的方法,其中给所述通信网格上的每一控制节点和工作者节点分...

【专利技术属性】
技术研发人员:理查德·奈特
申请(专利权)人:萨思学会有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1