本公开提供了一种分布式多机系统、控制方法及控制装置。其中,该分布式多机系统形成树形结构的多级关系,包括:根节点机、中间节点机、以及叶子节点机。根节点机以及中间节点机,被配置为接收子节点机上报的心跳状态,根据子节点机的心跳状态判断子节点机是否发生宕机。其中,中间节点机,还被配置为向父节点机上报心跳状态。叶子节点机,被配置为向父节点机上报心跳状态。从而由每个任务机检查改进为非叶子节点机检查,由检查所有任务机改进为检查自身的子节点机,减少了宕机检查的消耗,实现了减少计算资源浪费,提高分布式多机性能的目的。
【技术实现步骤摘要】
本公开涉及分布式多机领域,具体地,涉及一种分布式多机系统、控制方法及控制装置。
技术介绍
分布式多机系统是将多台任务机通过通信网络连接起来,协调地完成大规模任务的计算机系统。为了发现任务机宕机,分布式多机系统会建立一个共享资源池来记录各个任务机的心跳状态。每一任务机都定期去共享资源池来检测所有任务机的心跳状态,根据心跳状态来判断某一任务机是否发生宕机。然而,每一任务机都定期去共享资源池来检测所有任务机的心跳状态,造成各个任务机会反复的检测相同任务机的心跳状态,造成计算资源的浪费,降低了分布式多机的性能。
技术实现思路
有鉴于此,本公开提供了一种分布式多机系统、控制方法及控制装置,以实现减少计算资源浪费,提高分布式多机性能的目的。在本公开实施例的一个方面中,提供了一种分布式多机系统。该分布式多机系统形成树形结构的多级关系,包括:根节点机、中间节点机、以及叶子节点机。所述根节点机以及所述中间节点机,被配置为接收子节点机上报的心跳状态,根据所述子节点机的心跳状态判断所述子节点机是否发生宕机,其中,所述中间节点机,还被配置为向父节点机上报所述中间节点机的心跳状态。所述叶子节点机,被配置为向父节点机上报所述叶子节点机的心跳状态。可选地,所述根节点机以及所述中间节点机还被配置为在确定所述子节点机发生宕机的情况下,将所述分布式多机系统中的任一未发生宕机的叶子节点机补位到所述子节点机,并将所述子节点机尚未完成处理的任务重新分配给所述分布式多机的其他节点机。可选地,所述根节点机至少包括第一任务机以及第二任务机。其中,所述第一任务机,被配置为对所述第二任务机进行心跳监测,在监测到所述第二任务机发生宕机的情况下,将所述分布式多机系统中的任一未发生宕机的叶子节点机补位到所述第二任务机。可选地,所述根节点机还被配置为按预置的任务分发策略,计算出需要发放给每一节点机的任务,根据需要发放给每一节点机的任务,执行属于所述根节点机的任务,并将属于所述根节点机的子孙节点机的任务发放到相应的子节点机。所述中间节点机还被配置为接收父节点机分发的任务,执行属于所述中间节点机的任务,并将属于所述中间节点机的子孙节点机的任务发放到相应的子节点机。所述叶子节点机还被配置为接收父节点机分发的任务,执行属于所述叶子节点机的任务。可选地,所述任务分发策略为按所述分布式多机中任务机的数量平均分配任务。在本公开实施例的另一个方面中,提供了一种分布式多机系统控制方法。其中,所述分布式多机系统形成树形结构的多级关系。所述方法应用于所述分布式多机系统的非叶子节点机,所述方法包括:接收子节点机上报的心跳状态;根据所述子节点机的心跳状态判断所述子节点机是否发生宕机。可选地,所述方法还包括:在确定所述子节点机发生宕机的情况下,将所述分布式多机系统中的任一未发生宕机的叶子节点机补位到所述子节点机,并将所述子节点机尚未完成处理的任务重新分配给所述分布式多机的其他节点机。可选地,所述方法还包括:在所述非叶子节点为根节点机的情况下,所述根节点机按预置的任务分发策略,计算出需要发放给每一节点机的任务;所述根节点机根据需要发放给每一节点机的任务,执行属于所述根节点机的任务,并将属于所述根节点机的子孙节点机的任务发放到相应的子节点机;在所述非叶子节点为中间节点机的情况下,所述中间节点机接收到父节点机分发的任务,执行属于所述中间节点机的任务,并将属于所述中间节点机的子孙节点机的任务发放到相应的子节点机。可选地,所述任务分发策略为按所述分布式多机中任务机的数量平均分配任务。在本公开实施例的又一方面中,提供了一种分布式多机系统控制装置。所述分布式多机系统形成树形结构的多级关系,所述装置配置于所述分布式多机系统的非叶子节点机,所述装置包括:接收模块,被配置为接收子节点机上报的心跳状态。判断模块,被配置为根据所述子节点机的心跳状态判断所述子节点机是否发生宕机。通过上述技术方案,分布式多机系统形成树形结构的多级关系,非叶子节点机接收子节点机上报的心跳状态,非叶子节点机根据子节点机的心跳状态判断所述子节点机是否发生宕机,从而由每个任务机检查改进为非叶子节点机检查,由检查所有任务机改进为检查自身的子节点机,减少了宕机检查的消耗,实现了减少计算资源浪费,提高分布式多机性能的目的。本公开的其他特征和优点机将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:图1是根据一示例性实施例示出的实施环境示意图。图2是根据本专利技术的一示例性实施例示出的一种分布式多机系统。图3是根据本专利技术的一示例性实施例示出的一种分布式多机系统控制方法的流程图。图4是根据本专利技术的另一示例性实施例示出的一种分布式多机系统控制方法的流程图。图5是根据本专利技术的一示例性实施例示出的一种分布式多机系统控制装置的框图。图6是根据本专利技术的另一示例性实施例示出的一种分布式多机系统控制装置的框图。具体实施方式以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。图1是根据一示例性实施例示出的实施环境示意图。该实施环境包括:业务系统110以及分布式多机系统120。其中,所述业务系统110,用于产生任务。所述分布式多机系统120,用于执行业务系统110产生的任务。可以理解的是,图1所示实施环境仅用于示意本专利技术实施例提供的方法,并不构成对本专利技术实施例的限制。图2是根据本专利技术的一示例性实施例示出的一种分布式多机系统。如图2所示,该分布式多机系统形成树形结构的多级关系。该系统可以包括:根节点机210、中间节点机2201~2208、以及叶子节点机2301~2364。其中,图2所示分布式多机系统除了根节点机以外,每级包括8台任务机,且根节点机包括两台任务机、其他节点机包括一台任务机。可以理解的是,该图2所示系统仅为本公开实施例一可能的实施方式。实际上,分布式多机系统的级数、每级所包含的任务机的数量,以及,每个节点机所包含的任务机的数量,可以根据实际需要以及任务机计算能力来设置,本公开对此并不进行限制。其中,根节点机210以及中间节点机2201~1208,可以被配置为接收子节点机上报的心跳状态,根据所述子节点机的心跳状态判断所述子节点机是否发生宕机。例如,可以预设心跳间隔时长阈值,在子节点机最后一次上报的心跳状态距当前时刻超出心跳间隔时长阈值时,确定子节点机发生宕机。该中间节点机2201~2208,还可以被配置为向父节点机上报所述中间节点机的心跳状态。该叶子节点机2301~2364,可以被配置为向父节点机上报心跳状态。例如,如图2所示的根节点机210可以接收中间节点机2201~2208上报的心跳状态,中间节点机2201可以接收叶子节点机2301~2308上报的心跳状态,其他中间节点机以此类推,不再赘述。可见,由于本公开实施例的分布式多机系统形成树形结构的多级关系,非叶子节点机接收子节点机上报的心跳状态,非叶子节点机根据子节点机的心跳状态判断所述子节点机是否发生宕机,从而由每个任务机检查改进为非叶子节点机检查,由检查所有任务机改进为检查自身的子节点机,减本文档来自技高网...

【技术保护点】
一种分布式多机系统,其特征在于,所述分布式多机系统形成树形结构的多级关系,所述系统包括:根节点机、中间节点机、以及叶子节点机;所述根节点机以及所述中间节点机,被配置为接收子节点机上报的心跳状态,根据所述子节点机的心跳状态判断所述子节点机是否发生宕机;所述中间节点机,还被配置为向父节点机上报所述中间节点机的心跳状态;所述叶子节点机,被配置为向父节点机上报所述叶子节点机的心跳状态。
【技术特征摘要】
1.一种分布式多机系统,其特征在于,所述分布式多机系统形成树形结构的多级关系,所述系统包括:根节点机、中间节点机、以及叶子节点机;所述根节点机以及所述中间节点机,被配置为接收子节点机上报的心跳状态,根据所述子节点机的心跳状态判断所述子节点机是否发生宕机;所述中间节点机,还被配置为向父节点机上报所述中间节点机的心跳状态;所述叶子节点机,被配置为向父节点机上报所述叶子节点机的心跳状态。2.根据权利要求1所述的系统,其特征在于,所述根节点机以及所述中间节点机还被配置为在确定所述子节点机发生宕机的情况下,将所述分布式多机系统中的任一未发生宕机的叶子节点机补位到所述子节点机,并将所述子节点机尚未完成处理的任务重新分配给所述分布式多机的其他节点机。3.根据权利要求1所述的系统,其特征在于,所述根节点机至少包括第一任务机以及第二任务机;其中,所述第一任务机,被配置为对所述第二任务机进行心跳监测,在监测到所述第二任务机发生宕机的情况下,将所述分布式多机系统中的任一未发生宕机的叶子节点机补位到所述第二任务机。4.根据权利要求1所述的系统,其特征在于,所述根节点机还被配置为按预置的任务分发策略,计算出需要发放给每一节点机的任务,根据需要发放给每一节点机的任务,执行属于所述根节点机的任务,并将属于所述根节点机的子孙节点机的任务发放到相应的子节点机;所述中间节点机还被配置为接收父节点机分发的任务,执行属于所述中间节点机的任务,并将属于所述中间节点机的子孙节点机的任务发放到相应的子节点机;所述叶子节点机还被配置为接收父节点机分发的任务,执行属于所述叶子节点机的任务。5.根据权利要求4所述的系...
【专利技术属性】
技术研发人员:李东鸽,牟晓光,
申请(专利权)人:东软集团股份有限公司,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。