一种基于超算的横向扩展实现方法及系统技术方案

技术编号:33376668 阅读:10 留言:0更新日期:2022-05-11 22:44
本发明专利技术属于计算机领域,提供了一种基于超算的横向扩展实现方法及系统。该方法包括,同一局域网内的超算集群服务器、监控集群服务器和信息汇总服务器,根据新增超算集群服务器的指令,将新增超算集群服务器注册在监控集群中;监控集群根据所有的超算集群服务器重新规划每台监控服务器所需要监控的超算集群服务器数量;信息汇总服务器根据规划后每台监控服务器所需要监控的超算集群服务器数量,获取新增的监控服务器的超算集群服务器状态信息。增的监控服务器的超算集群服务器状态信息。增的监控服务器的超算集群服务器状态信息。

【技术实现步骤摘要】
一种基于超算的横向扩展实现方法及系统


[0001]本专利技术属于计算机领域,尤其涉及一种基于超算的横向扩展实现方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]随着高性能计算技术的发展,超算集群的稳定性已成为超算日常运行中的一个十分重要的组成部分,同时由于超算集群的复杂性以及超算规模的扩大,这给超算的稳定运行带来了许多不确定因素。当超算集群的规模越来越大时,如何监控整个超算系统的状态,如何保证监控质量,成为了一个关键的问题。
[0004]目前较为常见的解决方案,是将服务器的状态信息定时推送到指定服务器上存储,然后由指定服务器的信息进行可视化展示。这种方案的局限性在于,随着超算集群的规模越来越大,超算集群监控的可扩展性将越来越差,这就容易造成超算集群监控系统本身的时效性不准确,其监控系统本身的状态就会越来越不稳定。

技术实现思路

[0005]为了解决上述
技术介绍
中存在的技术问题,本专利技术提供一种基于超算的横向扩展实现方法及系统,其在不增加运维成本的前提下,设计出合理的监控方案。
[0006]为了实现上述目的,本专利技术采用如下技术方案:
[0007]本专利技术的第一个方面提供一种基于超算的横向扩展实现方法。
[0008]一种基于超算的横向扩展实现方法,包括:同一局域网内的超算集群服务器、监控集群服务器和信息汇总服务器,
[0009]根据新增超算集群服务器的指令,将新增超算集群服务器注册在监控集群中;
[0010]监控集群根据所有的超算集群服务器重新规划每台监控服务器所需要监控的超算集群服务器数量;
[0011]信息汇总服务器根据规划后每台监控服务器所需要监控的超算集群服务器数量,获取新增的监控服务器的超算集群服务器状态信息。
[0012]本专利技术的第二个方面提供一种基于超算的横向扩展实现系统。
[0013]一种基于超算的横向扩展实现系统,包括:同一局域网内的超算集群服务器、监控集群服务器和信息汇总服务器,其中:
[0014]监控集群服务器根据新增超算集群服务器的指令,将新增超算集群服务器注册在监控集群中;监控集群根据所有的超算集群服务器重新规划每台监控服务器所需要监控的超算集群服务器数量;
[0015]信息汇总服务器,根据规划后每台监控服务器所需要监控的超算集群服务器数量,获取新增的监控服务器的超算集群服务器状态信息。
[0016]本专利技术的第三个方面提供一种基于超算的横向扩展实现方法。
[0017]一种基于超算的横向扩展实现方法,包括:同一局域网内的超算集群服务器、监控集群服务器和信息汇总服务器,
[0018]根据新增监控集群服务器的指令,将新增监控集群服务器注册在监控集群中;
[0019]监控集群根据所有的监控集群服务器重新规划每台监控服务器所需要监控的超算集群服务器数量;
[0020]信息汇总服务器根据规划后每台监控服务器所需要监控的超算集群服务器数量,获取新增的监控服务器的超算集群服务器状态信息。
[0021]本专利技术的第四个方面提供一种基于超算的横向扩展实现系统。
[0022]一种基于超算的横向扩展实现系统,包括:同一局域网内的超算集群服务器、监控集群服务器和信息汇总服务器,其中:
[0023]监控集群服务器,根据新增监控集群服务器的指令,将新增监控集群服务器注册在监控集群中;监控集群根据所有的监控集群服务器重新规划每台监控服务器所需要监控的超算集群服务器数量;
[0024]信息汇总服务器,根据规划后每台监控服务器所需要监控的超算集群服务器数量,获取新增的监控服务器的超算集群服务器状态信息。
[0025]本专利技术的第五个方面提供一种计算机可读存储介质。
[0026]一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一个方面或第三个方面所述的基于超算的横向扩展实现方法中的步骤。
[0027]本专利技术的第六个方面提供一种计算机设备。
[0028]一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述第一个方面或第三个方面所述的基于超算的横向扩展实现方法中的步骤。
[0029]与现有技术相比,本专利技术的有益效果是:
[0030]相对于传统的监控方案,此监控方法在不确定超算规模大小的时候,更好的实现超算的监控,减少运维成本,实现更好的监控资源分配。且在超算规模不断扩大的时候,此方案对运维成本及监控资源分配的效果更加明显。
附图说明
[0031]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0032]图1是本专利技术实施例一示出的超算集群服务器横向扩展的监控方案框架图;
[0033]图2是本专利技术实施例三示出的监控服务器横向扩展示意图。
具体实施方式
[0034]下面结合附图与实施例对本专利技术作进一步说明。
[0035]应该指出,以下详细说明都是例示性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。
[0036]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根
据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0037]需要注意的是,附图中的流程图和框图示出了根据本公开的各种实施例的方法和系统的可能实现的体系架构、功能和操作。应当注意,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分可以包括一个或多个用于实现各个实施例中所规定的逻辑功能的可执行指令。也应当注意,在有些作为备选的实现中,方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,或者它们有时也可以按照相反的顺序执行,这取决于所涉及的功能。同样应当注意的是,流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合,可以使用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以使用专用硬件与计算机指令的组合来实现。
[0038]实施例一
[0039]如图1所示,本实施例提供了一种基于超算的横向扩展实现方法,该方法包括:同一局域网内的超算集群服务器、监控集群服务器和信息汇总服务器,
[0040]根据新增超算集群服务器的指令,将新增超算集群服务器注册在监控集群中;
[0041]监控集群根据所有的超算集群服务器重新规划每台监控服务器所需要监控的超算集群本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于超算的横向扩展实现方法,包括:同一局域网内的超算集群服务器、监控集群服务器和信息汇总服务器,其特征在于:根据新增超算集群服务器的指令,将新增超算集群服务器注册在监控集群中;监控集群根据所有的超算集群服务器重新规划每台监控服务器所需要监控的超算集群服务器数量;信息汇总服务器根据规划后每台监控服务器所需要监控的超算集群服务器数量,获取新增的监控服务器的超算集群服务器状态信息。2.根据权利要求1所述的基于超算的横向扩展实现方法,其特征在于,所述监控集群根据所有的超算集群服务器重新规划每台监控服务器所需要监控的超算集群服务器数量具体包括:监控集群收到注册通知后,按照注册时获得的主机名称将所有超算集群服务器按照字符串大小的规则从小到大排序;监控集群按照当前正常的监控服务器数量,计算每台监控服务器应该监控的超算服务器数量;监控集群根据当前存活的监控服务器按照主机名按照字符串大小的规则从小到大进行排序,每台监控服务器将按照可监控服务器的最大数量从已排好序的超算集群服务器来获取指定数量的主机进行监控。3.根据权利要求2所述的基于超算的横向扩展实现方法,其特征在于,所述每台监控服务器应该监控的超算服务器数量=所要监控的总超算集群服务器数量/当前存活的监控服务器的数量。4.一种基于超算的横向扩展实现系统,包括:同一局域网内的超算集群服务器、监控集群服务器和信息汇总服务器,其特征在于:监控集群服务器根据新增超算集群服务器的指令,将新增超算集群服务器注册在监控集群中;监控集群根据所有的超算集群服务器重新规划每台监控服务器所需要监控的超算集群服务器数量;信息汇总服务器,根据规划后每台监控服务器所需要监控的超算集群服务器数量,获取新增的监控服务器的超算集群服务器状态信息。5.一种基于超算的横向扩展实现方法,包括:同一局域网内的超算集群服务器、监控集群服务器和信息汇总服务器,其特征在于:根据新增监控集群服务器的指令,将新增监控集群服务器注册在监控集群中;监控集群根据所有的监控集群服务器重新规划每台监控服务器所需要监控的超算...

【专利技术属性】
技术研发人员:涂阳韩昊李国庆樊悦强
申请(专利权)人:济南超级计算技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1