高性能集群监控方法、设备、装置及存储介质制造方法及图纸

技术编号:19933914 阅读:16 留言:0更新日期:2018-12-29 04:27
本发明专利技术公开了一种高性能集群监控方法、设备、装置及存储介质,所述方法包括:获取高性能集群中的待监控节点;在所述待监控节点运行目标应用软件时,采集所述待监控节点的性能数据;根据所述性能数据生成所述高性能集群的应用运行特征文件;对所述应用运行特征文件进行离线分析。通过实时采集各节点的性能数据,能够实时监控高性能集群中应用软件的运行状态,并且在监控整体集群性能状态的同时,将性能数据保存为应用运行特征文件,可供离线性能分析使用。

【技术实现步骤摘要】
高性能集群监控方法、设备、装置及存储介质
本专利技术涉及集群监控
,尤其涉及一种高性能集群监控方法、设备、装置及存储介质。
技术介绍
高性能计算集群(HPC,HighPerformanceComputing)是指能够执行一般个人电脑无法处理的大资料量与高速运算的电脑,其基本组成组件与个人电脑的概念无太大差异,但规格与性能则强大许多。然而,现有的高性能计算集群在面对复杂、大规模的作业管理和调度的时候,无法实时对高性能集群进行监控,了解集群中应用软件的运行状态。
技术实现思路
本专利技术的主要目的在于提供一种高性能集群监控方法、设备、装置及存储介质,旨在解决现有技术中无法实时对高性能集群进行监控,了解集群中应用软件的运行状态的技术问题。为实现上述目的,本专利技术提供一种高性能集群监控方法,所述方法包括以下步骤:获取高性能集群中的待监控节点;在所述待监控节点运行目标应用软件时,采集所述待监控节点的性能数据;根据所述性能数据生成所述高性能集群的应用运行特征文件;对所述应用运行特征文件进行离线分析。优选地,所述在所述待监控节点运行目标应用软件时,采集所述待监控节点的性能数据之后,所述方法还包括:通过前台节点运行图形窗口界面,所述图形窗口界面包括各待监控节点对应的图形窗口;根据所述性能数据生成各待监控节点的应用运行特征直方图,并通过各待监控节点对应的图形窗口显示所述应用运行特征直方图。优选地,所述通过各待监控节点对应的图形窗口显示所述应用运行特征直方图之后,所述方法还包括:监控所述待监控节点是否处于异常状态;获取处于异常状态的待监控节点对应的目标图形窗口,通过预设报警颜色闪烁显示所述目标图形窗口。优选地,所述对所述应用运行特征文件进行离线分析之前,所述方法还包括:调用与所述高性能集群关联的预设调度系统的应用程序接口,并从所述应用程序接口获取所述预设调度系统的调度数据;相应地,所述对所述应用运行特征文件进行离线分析,具体包括:对所述应用运行特征文件与所述调度数据进行离线分析。优选地,所述对所述应用运行特征文件与所述调度数据进行离线分析,具体包括:从所述应用运行特征文件中提取所述性能数据,并对所述性能数据与所述调度数据进行显示;根据所述性能数据与所述调度数据重构所述高性能集群的应用运行过程。优选地,所述根据所述性能数据与所述调度数据重构所述高性能集群的应用运行过程,具体包括:根据所述性能数据与所述调度数据生成应用运行特征曲线图,并显示所述应用运行特征曲线图。优选地,所述根据所述性能数据与所述调度数据生成应用运行特征曲线图,并显示所述应用运行特征曲线图之后,所述方法还包括:对所述应用运行特征曲线图进行分析,根据分析结果对所述目标应用软件的硬件进行配置。此外,为实现上述目的,本专利技术还提供一种高性能集群监控设备,所述高性能集群监控设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的高性能集群监控程序,所述高性能集群监控程序被所述处理器执行时实现如上文所述高性能集群监控方法的步骤。此外,为实现上述目的,本专利技术还提供一种高性能集群监控装置,所述高性能集群监控装置包括:节点获取模块、数据采集模块、文件生成模块与数据分析模块;所述节点获取模块,用于获取高性能集群中的待监控节点;所述数据采集模块,用于在所述待监控节点运行目标应用软件时,采集所述待监控节点的性能数据;所述文件生成模块,用于根据所述性能数据生成所述高性能集群的应用运行特征文件;所述数据分析模块,用于对所述应用运行特征文件进行离线分析。此外,为实现上述目的,本专利技术还提供一种存储介质,所述存储介质上存储有高性能集群监控程序,所述高性能集群监控程序被处理器执行时实现如上文所述高性能集群监控方法的步骤。在本专利技术中,通过获取高性能集群中的待监控节点;在所述待监控节点运行目标应用软件时,采集所述待监控节点的性能数据;根据所述性能数据生成所述高性能集群的应用运行特征文件;对所述应用运行特征文件进行离线分析。通过实时采集各节点的性能数据,能够实时监控高性能集群中应用软件的运行状态,并且在监控整体集群性能状态的同时,将性能数据保存为应用运行特征文件,可供离线性能分析使用。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的高性能集群监控设备结构示意图;图2为本专利技术高性能集群监控方法第一实施例的流程示意图;图3为本专利技术高性能集群监控方法第二实施例的流程示意图;图4为本专利技术高性能集群监控方法第三实施例的流程示意图;图5为本专利技术高性能集群监控装置第一实施例的功能模块图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。参照图1,图1为本专利技术实施例方案涉及的硬件运行环境的高性能集群监控设备结构示意图。如图1所示,所述高性能集群监控设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储服务器。本领域技术人员可以理解,图1中示出的结构并不构成对所述高性能集群监控设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。如图1所示,作为一种存储介质的存储器1005中可以包括操作装置、网络通信模块、用户接口模块以及高性能集群监控程序。所述高性能集群监控设备通过处理器1001调用存储器1005中存储的高性能集群监控程序,并执行以下操作:获取高性能集群中的待监控节点;在所述待监控节点运行目标应用软件时,采集所述待监控节点的性能数据;根据所述性能数据生成所述高性能集群的应用运行特征文件;对所述应用运行特征文件进行离线分析。进一步地,处理器1001可以调用存储器1005中存储的高性能集群监控程序,还执行以下操作:通过前台节点运行图形窗口界面,所述图形窗口界面包括各待监控节点对应的图形窗口;根据所述性能数据生成各待监控节点的应用运行特征直方图,并通过各待监控节点对应的图形窗口显示所述应用运行特征直方图。进一步地,处理器1001可以调用存储器1005中存储的高性能集群监控程序,还执行以下操作:监控所述待监控节点是否处于异常状态;获取处于异常状态的待监控节点对应的目标图形窗口,通过预设报警颜色闪烁显示所述目标图形窗口。进一步地,处理器1001可以调用存储器1005中存储的高性能集群监控程序,还执行以下操作:调用与所述高性能集群关联的预设调度系统的应用程序接口,并从所述应用程序接口获取所述预设调度系统的调度数据;对所述应用运行特征文件与所述调度数据进行离线分析。进一步地,处理器1001可以调用存储器1005中存储的高性能集群监控程序,还执行以下操作:从所述应用运行特征文件中提取所述性能数据,并对所述性能数据与所述调度数本文档来自技高网...

【技术保护点】
1.一种高性能集群监控方法,其特征在于,所述高性能集群监控方法包括以下步骤:获取高性能集群中的待监控节点;在所述待监控节点运行目标应用软件时,采集所述待监控节点的性能数据;根据所述性能数据生成所述高性能集群的应用运行特征文件;对所述应用运行特征文件进行离线分析。

【技术特征摘要】
1.一种高性能集群监控方法,其特征在于,所述高性能集群监控方法包括以下步骤:获取高性能集群中的待监控节点;在所述待监控节点运行目标应用软件时,采集所述待监控节点的性能数据;根据所述性能数据生成所述高性能集群的应用运行特征文件;对所述应用运行特征文件进行离线分析。2.如权利要求1所述的高性能集群监控方法,其特征在于,所述在所述待监控节点运行目标应用软件时,采集所述待监控节点的性能数据之后,所述方法还包括:通过前台节点运行图形窗口界面,所述图形窗口界面包括各待监控节点对应的图形窗口;根据所述性能数据生成各待监控节点的应用运行特征直方图,并通过各待监控节点对应的图形窗口显示所述应用运行特征直方图。3.如权利要求2所述的高性能集群监控方法,其特征在于,所述通过各待监控节点对应的图形窗口显示所述应用运行特征直方图之后,所述方法还包括:监控所述待监控节点是否处于异常状态;获取处于异常状态的待监控节点对应的目标图形窗口,通过预设报警颜色闪烁显示所述目标图形窗口。4.如权利要求1所述的高性能集群监控方法,其特征在于,所述对所述应用运行特征文件进行离线分析之前,所述方法还包括:调用与所述高性能集群关联的预设调度系统的应用程序接口,并从所述应用程序接口获取所述预设调度系统的调度数据;相应地,所述对所述应用运行特征文件进行离线分析,具体包括:对所述应用运行特征文件与所述调度数据进行离线分析。5.如权利要求4所述的高性能集群监控方法,其特征在于,所述对所述应用运行特征文件与所述调度数据进行离线分析,具体包括:从所述应用运行特征文件中提取所述性能数据,并对所...

【专利技术属性】
技术研发人员:赵扬雷鸣
申请(专利权)人:武汉索雅信息技术有限公司
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1