一种基于超级计算机实验室的远程管理系统及其管理方法技术方案

技术编号:38222770 阅读:7 留言:0更新日期:2023-07-25 17:54
本申请公开了一种基于超级计算机实验室的远程管理系统及其管理方法,涉及软件管理技术领域,该远程管理系统包括:超算集群管理系统和机房环境管理系统,其中,超算集群管理系统包括节点管理模块、重启设置模块、命令终端模块和AI节点模块,机房环境管理系统包括网关管理模块、环控管理模块、视频监控模块和堡垒机模块。本申请通过远程管理系统远程统一调控超算集群管理系统和机房环境管理系统及其相关模块,能够实现对超级计算机的远程监控与管理,从而有效减少超级计算机管理员在处理超级计算机实验室问题时往返于办公室及实验室的通勤时间,提高实验室管理效率,并能够使超级计算机管理员及时对相关系统出现的问题进行分析以便及时排查故障。分析以便及时排查故障。分析以便及时排查故障。

【技术实现步骤摘要】
一种基于超级计算机实验室的远程管理系统及其管理方法


[0001]本专利技术涉及软件管理
,特别涉及一种基于超级计算机实验室的远程管理系统及其管理方法。

技术介绍

[0002]当前,随着超级计算机的高速发展,其配套管理设施越来越完善,超级计算机的配套管理系统的数量也越来越多,超级计算机管理员根据需要的配套设施对超级计算机进行管理,例如各个节点管理、视频监控、网关管理、命令终端、节点重启、环境监控管理等等,目前,超级计算机实验室有多个系统,比如,节点管理系统、环境监控系统、摄像监控系统、网关管理、堡垒机等系统,上述系统分别通过WEB技术搭建成网页的形式,由于对上述系统的使用均需要在实验室中进行操作,不能通过校园网进行远程操作,所以对于超级计算机实验室的管理者而言,在处理超级计算机实验室问题时难免会需要耗费大量的往返于实验室与办公室的交通时间,并且当实验室中的设备发生故障,各系统发出告警时,无法第一时间了解故障信息并及时前往现场做出相应的安全处理。并且作业的过程中还需要使用命令终端,在运维的过程中还涉及对超级计算机模块重启等操作,这些操作通常需要搭建SSH(Secure Shell,安全外壳)隧道,其中,搭建SSH隧道需要通过MobaXtern或者Putty等客户端对超算节点进行搭建,步骤繁琐。最后,由于节点管理系统、环境监控系统、摄像监控系统、网关管理系统、命令终端等系统均是独立系统,使用时还需要分别登录,账号密码繁多,操作步骤繁琐。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种基于超级计算机实验室的远程管理系统及其管理方法,能够使得超级计算机管理员可远程对超级计算机进行监控与管理,有效减少超级计算机管理员在处理超级计算机实验室问题时往返于办公室及实验室的通勤时间,提高实验室管理效率,并能够使超级计算机管理员及时对相关系统出现的问题进行分析以便及时排查故障。其具体方案如下:
[0004]第一方面,本申请公开了一种基于超级计算机实验室的远程管理系统,包括:
[0005]超算集群管理系统,用于统一管理节点、命令终端,并控制节点的重启;其中,所述超算集群管理系统包括节点管理模块、重启设置模块、命令终端模块和AI节点模块;
[0006]机房环境管理系统,用于对超级计算机实验室中的各基础设施进行远程监控与管理;所述机房环境管理系统包括网关管理模块、环控管理模块、视频监控模块和堡垒机模块。
[0007]可选的,所述超算集群管理系统包含第一超级计算机模块和第二超级计算机模块;其中,所述第一超级计算机模块为整合第一节点管理模块、所述重启设置模块和第一命令终端模块的超级计算机,并且所述第二超级计算机模块为整合第二节点管理模块、第二命令终端模块和所述AI节点模块的超级计算机。
[0008]可选的,所述第一节点管理模块,用于管理所述第一超级计算机模块中相应的节点。
[0009]可选的,所述第二节点管理模块,用于管理所述第二超级计算机模块中相应的节点。
[0010]可选的,所述重启设置模块,用于对所述第一超级计算机模块中的所述节点进行重启管理。
[0011]可选的,所述第一命令终端模块,用于提供对所述第一超级计算机模块的命令终端进行操作的操作平台;
[0012]以及,所述第二命令终端模块,用于提供对所述第二超级计算机模块的命令终端进行操作的操作平台。
[0013]可选的,所述AI节点模块,用于管理所述第二超级计算机模块中的AI节点。
[0014]可选的,所述基于超级计算机实验室的远程管理系统为WEB系统。
[0015]第二方面,本申请公开了一种管理方法,应用于后端,包括:
[0016]整合通过前端反馈的信息得到整合后信息;所述信息为与远程操作指令相关的信息,并且所述远程操作指令为所述前端接收到的因客户端基于所述前端控制和管理超级计算机实验室各系统的操作而发出的指令;
[0017]将所述整合后信息反馈至如上述的基于超级计算机实验室的远程管理系统;
[0018]提取所述远程管理系统响应所述整合后信息输出的数据;
[0019]将所述数据传送至所述前端,以便所述前端根据所述数据渲染页面,并将渲染后页面反馈至所述客户端以实现超级计算机管理员对超级计算机的远程监控与管理。
[0020]可选的,所述前端通过HTML技术、JavaScript技术和CSS技术渲染页面,并通过Python技术和Go技术实现与所述后端相关的数据处理操作。
[0021]第三方面,本申请公开了一种电子设备,包括:
[0022]存储器,用于保存计算机程序;
[0023]处理器,用于执行所述计算机程序,以实现前述公开的管理方法的步骤。
[0024]第四方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的管理方法的步骤。可见,本申请提供了一种基于超级计算机实验室的远程管理系统,包括:用于统一管理节点、命令终端,并控制节点重启的超算集群管理系统和用于对超级计算机实验室中的各基础设施进行远程监控与管理的机房环境管理系统;其中,所述超算集群管理系统包括节点管理模块、重启设置模块、命令终端模块和AI节点模块;所述机房环境管理系统包括网关管理模块、环控管理模块、视频监控模块和堡垒机模块。由此可知,本申请通过远程管理系统统一调控超算集群管理系统和机房环境管理系统及其相关模块,实现对超级计算机的远程监控与管理,从而能够有效减少超级计算机管理员在处理超级计算机实验室问题时往返于办公室及实验室的通勤时间,提高实验室管理效率,并能够使得超级计算机管理员及时对相关系统出现的问题进行分析以便及时排查故障。
附图说明
[0025]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0026]图1为本申请公开的一种基于超级计算机实验室的远程管理系统结构示意图;
[0027]图2为本申请公开的一种具体的基于超级计算机实验室的远程管理系统结构示意图;
[0028]图3为本申请公开的一种基于超级计算机实验室的远程管理系统前端主页面示意图;
[0029]图4为本申请公开的一种曙光超级计算机模块功能页面示意图;
[0030]图5为本申请公开的一种点击“节点管理”时显示的页面示意图;
[0031]图6为本申请公开的一种点击“重启设置”的节点一键重启示意图;
[0032]图7为本申请公开的一种点击“命令终端”时对曙光超级计算机模块“命令终端”的操作示意图;
[0033]图8为本申请公开的一种浪潮超级计算机模块功能页面示意图;
[0034]图9为本申请公开的另一种“节点管理”显示页面示意图;
[0035]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于超级计算机实验室的远程管理系统,其特征在于,包括:超算集群管理系统,用于统一管理节点、命令终端,并控制节点的重启;其中,所述超算集群管理系统包括节点管理模块、重启设置模块、命令终端模块和AI节点模块;机房环境管理系统,用于对超级计算机实验室中的各基础设施进行远程监控与管理;所述机房环境管理系统包括网关管理模块、环控管理模块、视频监控模块和堡垒机模块。2.根据权利要求1所述的基于超级计算机实验室的远程管理系统,其特征在于,所述超算集群管理系统包含第一超级计算机模块和第二超级计算机模块;其中,所述第一超级计算机模块为整合第一节点管理模块、所述重启设置模块和第一命令终端模块的超级计算机,并且所述第二超级计算机模块为整合第二节点管理模块、第二命令终端模块和所述AI节点模块的超级计算机。3.根据权利要求2所述的基于超级计算机实验室的远程管理系统,其特征在于,所述第一节点管理模块,用于管理所述第一超级计算机模块中相应的节点。4.根据权利要求2所述的基于超级计算机实验室的远程管理系统,其特征在于,所述第二节点管理模块,用于管理所述第二超级计算机模块中相应的节点。5.根据权利要求2所述的基于超级计算机实验室的远程管理系统,其特征在于,所述重启设置模块,用于对所述第一超级计算机模块中的所述节点进行重启管理。6.根据权利要求2所述的基于超级计算机实验室的远程...

【专利技术属性】
技术研发人员:张阳光陈集文黄荣威郑泽龙张华周沧涛
申请(专利权)人:深圳技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1