分布式系统及其管理方法和管理装置制造方法及图纸

技术编号:15727110 阅读:408 留言:0更新日期:2017-06-29 23:38
本发明专利技术公开了一种分布式系统及其管理方法和管理装置。分布式系统包括管理节点和用于运行任务的多个业务节点,多个业务节点分属于至少两个应用组,每个应用组包括至少一个业务节点以用于特定应用。多个业务节点周期性地向管理节点发送其自身的状态信息。管理节点根据多个业务节点的状态信息,判定各个业务节点是否可用,并根据各个业务节点所属的应用组确定各个应用组分别包含的可用业务节点数量,以判定各个应用组是否可用,最后根据可用应用组的数量判定分布式系统是否可用。由此可以避免由于部分应用组异常导致整个分布式系统被判定为不可用,使得其它正常应用组也不可服务的情况的发生。

【技术实现步骤摘要】
分布式系统及其管理方法和管理装置
本专利技术涉及分布式
,特别是涉及一种分布式系统及其管理方法和管理装置。
技术介绍
分布式系统的核心理念是让多台服务器协同工作,完成单台服务器无法处理的任务,尤其是高并发或者大数据量的任务。一般来说,分布式系统在实现上主要包括任务分发进程和任务执行进程。任务分发进程主要是将任务分发给分布式系统中的多台服务器,由部署在服务器上的任务执行进程执行为其分配的任务。目前,分布式系统的健康状态一般是根据服务器上的任务执行进程的执行状态判定的。具体地,当处于异常状态的任务执行进程超过预定阈值时,即判定该分布式系统不可用,并禁止任务分发进程下发新的任务。然而部署在分布式系统中的集群服务器上的任务执行进程一般可以分属于多个应用,每个应用可以包括多个任务执行进程。基于现有的判断机制,当发生异常的任务执行进程集中在某个应用下且数量超过阈值时,分布式系统会被判定为不可用,任务分发进程也会停止下发新的任务,这样会导致正常状态的其它应用下的任务执行进程也处于不可服务状态。因此,需要一种能够对分布式系统的健康状态进行更为准确判定的方案。
技术实现思路
本专利技术的主要目的在于提供一种分布式系统及其管理方法和管理装置,其从应用维度出发对分布式系统的健康状态进行判断,能够有效避免由于某个应用异常造成整个分布式系统不可服务的情况的发生。根据本专利技术的一个方面,提供了一种分布式系统,包括管理节点和用于运行任务的多个业务节点,多个业务节点分属于至少两个应用组,每个应用组包括至少一个业务节点以用于特定应用,其中,多个业务节点周期性地向管理节点发送其自身的状态信息;管理节点根据多个业务节点的状态信息,判定各个业务节点是否可用;管理节点根据各个业务节点所属的应用组确定各个应用组分别包含的可用业务节点数量,以判定各个应用组是否可用;以及管理节点根据可用应用组的数量判定分布式系统是否可用。由此本专利技术从应用维度出发,以可用应用组的数量为基准来判断分布式系统是否可用。与单纯以可用的业务节点的数量为基准来判断分布式系统是否可用相比,可以避免由于某个或某些应用组异常导致整个分布式系统被判定为不可用,使得其它正常应用组也不可服务的情况的发生。优选地,管理节点根据多个业务节点的状态信息判定各个业务节点是否可用,包括:在业务节点的状态信息指示该业务节点繁忙时判定该业务节点不可用;以及在没有接收到业务节点的状态信息时判定该业务节点不可用。由此可以根据业务节点的存活状态或健康状态这两个方面来判断该业务节点是否可用。优选地,管理节点可以根据如下至少之一确定各个业务节点所属的应用组:管理节点保存的各个业务节点所属应用列表;各个业务节点在系统初始化时上报的所属应用信息;以及业务节点周期性发送的状态信息中包含的所属应用信息。由此可以通过多种方式来灵活确定业务节点所属的应用组。优选地,管理节点可以在应用组包含的业务节点都不可用的情况下才判定该应用组不可用,以尽可能地维持应用/系统的可服务性。优选地,管理节点根据可用应用组的数量判定分布式系统是否可用可以包括:管理节点在可用应用组的数量与应用组总数量之比达到预定阈值时判定分布式系统可用。优选地,管理节点包括任务分发子节点和信息汇总子节点,并且其中,信息汇总子节点周期性地汇总多个业务节点的状态信息并将汇总的状态信息上报给任务分发子节点;任务分发子节点根据汇总的状态信息判定分布式系统是否可用,并且在判定分布式系统可用时向可用的业务节点分发任务。由此,在判定分布式系统可用时,可以由任务分发子节点继续向可用的业务节点分发任务,使得可用的业务节点能够正常提供服务。根据本专利技术的另一个方面,还提供了一种分布式系统的管理装置,分布式系统包括用于运行任务的多个业务节点,多个业务节点分属于至少两个应用组,每个应用组包括至少一个业务节点以用于特定应用,管理装置包括:信息获取单元,用于周期性地获取多个业务节点的状态信息;可用节点判断单元,用于根据多个业务节点的状态信息,判定各个业务节点是否可用;可用应用组判断单元,用于根据各个业务节点所属的应用组确定各个应用组分别包含的可用业务节点数量,以判定各个应用组是否可用;以及系统可用判断单元,用于根据可用应用组的数量判定分布式系统是否可用。优选地,可用节点判断单元还可以用于:在业务节点的状态信息指示该业务节点繁忙时判定该业务节点不可用;以及在没有接收到业务节点的状态信息时判定该业务节点不可用。优选地,系统可用判断单元应用在可用应用组的数量与应用组总数量之比达到预定阈值时判定分布式系统可用。优选地,该管理装置还可以包括任务分发子单元,用于在系统可用判断单元判定分布式系统可用时向可用的业务节点分发任务。根据本专利技术的又一个方面,还提供了一种分布式系统的管理方法,分布式系统包括用于运行任务的多个业务节点,多个业务节点分属于至少两个应用组,每个应用组包括至少一个业务节点以用于特定应用,管理方法包括:周期性地获取多个业务节点的状态信息;根据多个业务节点的状态信息,判定各个业务节点是否可用;根据各个业务节点所属的应用组确定各个应用组分别包含的可用业务节点数量,以判定各个应用组是否可用;以及根据可用应用组的数量判定分布式系统是否可用。优选地,该管理方法可以根据如下至少之一确定各个业务节点所属的应用组:管理节点保存的各个业务节点所属应用列表;各个业务节点在系统初始化时上报的所属应用信息;以及业务节点周期性发送的状态信息中包含的所属应用信息。优选地,该管理方法还可以包括:在判定分布式系统可用时向可用的业务节点分发任务。本专利技术的分布式系统及其管理方法和管理装置从应用维度出发,以可用应用组的数量为基准来判断分布式系统是否可用。与单纯以可用的业务节点的数量为基准来判断分布式系统是否可用相比,可以避免由于某个应用组异常导致整个分布式系统被判定为不可用,使得其它正常应用组也不可服务的情况的发生。附图说明通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。图1是示出了根据本专利技术一实施例的分布式系统的功能框图。图2是示出了根据本专利技术一实施例的分布式系统的管理装置的结构的示意性方框图。图3是示出了根据本专利技术一实施例的分布式系统的管理方法的示意性流程图。图4A-C描述了根据本专利技术的一个应用例。具体实施方式下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。下面将参照图1至图3来具体地描述本专利技术的实施例。图1是示出了根据本专利技术一实施例的分布式系统100的功能框图。如图1所示,分布式系统100包括管理节点110和多个业务节点120。在这里,“节点”可以指的是分布式系统中运行“进程”的载体。管理节点110和业务节点120均可以部署在分布式系统100下的集群服务器中。其中,在同一服务器上可以部署一个业务节点120,也可以部署两个或更多个业务节点120。管理节点110可以部署在不同于业务节点120的本文档来自技高网...
分布式系统及其管理方法和管理装置

【技术保护点】
一种分布式系统,包括管理节点和用于运行任务的多个业务节点,所述多个业务节点分属于至少两个应用组,每个应用组包括至少一个业务节点以用于特定应用,其中,所述多个业务节点周期性地向所述管理节点发送其自身的状态信息;所述管理节点根据所述多个业务节点的状态信息,判定各个业务节点是否可用;所述管理节点根据各个业务节点所属的应用组确定各个应用组分别包含的可用业务节点数量,以判定各个应用组是否可用;以及所述管理节点根据可用应用组的数量判定所述分布式系统是否可用。

【技术特征摘要】
1.一种分布式系统,包括管理节点和用于运行任务的多个业务节点,所述多个业务节点分属于至少两个应用组,每个应用组包括至少一个业务节点以用于特定应用,其中,所述多个业务节点周期性地向所述管理节点发送其自身的状态信息;所述管理节点根据所述多个业务节点的状态信息,判定各个业务节点是否可用;所述管理节点根据各个业务节点所属的应用组确定各个应用组分别包含的可用业务节点数量,以判定各个应用组是否可用;以及所述管理节点根据可用应用组的数量判定所述分布式系统是否可用。2.如权利要求1所述的分布式系统,其中,所述管理节点根据所述多个业务节点的状态信息判定各个业务节点是否可用,包括:在业务节点的状态信息指示该业务节点繁忙时判定该业务节点不可用;以及在没有接收到业务节点的状态信息时判定该业务节点不可用。3.如权利要求1所述的分布式系统,其中,所述管理节点根据如下至少之一确定各个业务节点所属的应用组:所述管理节点保存的各个业务节点所属应用列表;各个业务节点在系统初始化时上报的所属应用信息;以及所述业务节点周期性发送的状态信息中包含的所属应用信息。4.如权利要求1所述的分布式系统,其中,所述管理节点在应用组包含的业务节点都不可用的情况下判定该应用组不可用。5.如权利要求1所述的分布式系统,其中,所述管理节点根据可用应用组的数量判定所述分布式系统是否可用包括:所述管理节点在可用应用组的数量与应用组总数量之比达到预定阈值时判定所述分布式系统可用。6.如权利要求1所述的分布式系统,其中,所述管理节点包括任务分发子节点和信息汇总子节点,并且其中,所述信息汇总子节点周期性地汇总所述多个业务节点的状态信息并将汇总的所述状态信息上报给所述任务分发子节点;所述任务分发子节点根据汇总的所述状态信息判定所述分布式系统是否可用,并且在判定所述分布式系统可用时向可用的业务节点分发任务。7.一种分布式系统的管理装置,所述分布式系统包括用于运行任务的多个业务节点,所述多个...

【专利技术属性】
技术研发人员:王新栋卢申朋褚建辉刘东辉
申请(专利权)人:广东神马搜索科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1