一种BMC监控GPU的方法、系统、装置及存储介质制造方法及图纸

技术编号:18426125 阅读:5 留言:0更新日期:2018-07-12 01:56
本发明专利技术公开了一种BMC监控GPU的方法、系统、装置及存储介质,包括:服务器中的BMC每隔预设时间发送读取指令,以便于服务器中的GPU在接收到读取指令后收集当前GPU信息;BMC根据当前GPU信息对GPU进行监控。本申请通过BMC每隔设置好的时间,即定期发送读取指令至GPU。当GPU接收到读取指令后,便开始收集体现GPU的当前性能或其他信息的当前GPU信息,并将当前GPU信息发送至BMC。然后,BMC根据当前GPU信息对GPU进行监控。可见,本申请无需维护人员安装GPU的驱动和相关监控软件,简化了监控过程,提高了监控效率;且BMC可以定期自动获取GPU信息,实现自动监控GPU的状态,比较智能。

A method, system, device and storage medium for BMC monitoring GPU

The invention discloses a method, system, device and storage medium of BMC monitoring GPU, including: the BMC in the server sends reading instructions at every default time, so that the GPU in the server collects the current GPU information after receiving the read instruction; BMC monitors GPU according to the current GPU information. This application sends regular read instructions to GPU through BMC at regular intervals. When GPU receives the read instruction, it begins to collect the current GPU information that reflects the current performance or other information of GPU, and sends the current GPU information to BMC. Then, BMC monitors the GPU according to the current GPU information. It can be seen that the application does not need to maintain the driver and related monitoring software to install GPU, simplify the monitoring process and improve the monitoring efficiency; and BMC can automatically obtain GPU information on a regular basis to realize the automatic monitoring of the state of the GPU, and more intelligent.

【技术实现步骤摘要】
一种BMC监控GPU的方法、系统、装置及存储介质
本专利技术涉及监控
,特别是涉及一种BMC监控GPU的方法、系统、装置及计算机可读存储介质。
技术介绍
随着云计算和大数据的发展,服务器需要进行大量的计算工作。为了满足快速的数据运算,通常将GPU(GraphicsProcessingUnit,图形处理器)配置在服务器中。GPU主要完成图像处理的数据运算,使服务器中的CPU从图形处理的任务中解放出来,从而去执行更多其他的系统任务,提高了服务器的整体性能。可见,对GPU的监控尤为重要。现有技术中,通过维护人员安装GPU的驱动和相关监控软件,然后手动运行相关监控软件实现对GPU的监控,使得监控过程比较繁琐,监控效率低,对于维护人员的要求也比较高;而且,无法实现自动监控GPU的状态,不够智能。因此,如何提供一种解决上述技术问题的方案是本领域的技术人员目前需要解决的问题。
技术实现思路
本专利技术的目的是提供一种BMC监控GPU的方法、系统、装置及计算机可读存储介质,无需维护人员安装GPU的驱动和相关监控软件,简化了监控过程,提高了监控效率;而且,BMC可以定期自动获取GPU信息,实现自动监控GPU的状态,比较智能。为解决上述技术问题,本专利技术提供了一种BMC监控GPU的方法,包括:服务器中的基板管理控制器BMC每隔预设时间发送读取指令,以便于所述服务器中的图形处理器GPU在接收到所述读取指令后收集当前GPU信息;所述BMC根据所述当前GPU信息对所述GPU进行监控。优选地,该方法还包括:所述BMC预先定义一个GPU结构体,将所述当前GPU信息保存至所述GPU结构体。优选地,该方法还包括:所述BMC在接收用户通过浏览器发送的访问请求后,将所述GPU结构体内的当前GPU信息显示于自身的web界面,以便于所述用户根据所述web界面的显示了解所述GPU的当前运行状态及当前健康状况。优选地,所述当前GPU信息包括所述GPU的厂商id和/或设备id和/或当前温度和/或当前功耗和/或当前内存错误次数。优选地,所述BMC根据所述当前GPU信息对所述GPU进行监控的过程具体为:所述BMC比较所述当前温度与预设温度和/或比较所述当前功耗与预设功耗和/或比较所述当前内存错误次数与预设次数,相应地,当所述当前温度大于所述预设温度时,将所述当前温度及温度比较结果均显示于自身的web界面和/或当所述当前功耗大于所述预设功耗时,将所述当前功耗及功耗比较结果均显示于所述web界面和/或当所述当前内存错误次数大于所述预设次数时,将所述当前内存错误次数及次数比较结果均显示于所述web界面。优选地,所述BMC获取所述当前GPU信息的过程具体为:所述BMC通过I2C总线从所述GPU中获取所述当前GPU信息。为解决上述技术问题,本专利技术还提供了一种BMC监控GPU的系统,包括:读取单元,用于每隔预设时间发送读取指令,以便于所述服务器中的GPU在接收到所述读取指令后收集当前GPU信息;监控单元,用于根据所述当前GPU信息对所述GPU进行监控。优选地,该系统还包括:保存单元,用于预先定义一个GPU结构体,将所述当前GPU信息保存至所述GPU结构体。为解决上述技术问题,本专利技术还提供了一种BMC监控GPU的装置,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述任一种BMC监控GPU的方法的步骤。为解决上述技术问题,本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种BMC监控GPU的方法的步骤。本专利技术提供了一种BMC监控GPU的方法,包括:服务器中的基板管理控制器BMC每隔预设时间发送读取指令,以便于服务器中的图形处理器GPU在接收到读取指令后收集当前GPU信息;BMC根据当前GPU信息对GPU进行监控。与现有技术中的监控GPU的方法相比,本申请通过服务器中的BMC每隔设置好的时间,即定期发送读取指令至该服务器中的GPU。当GPU接收到读取指令后,便开始收集可以体现GPU的当前性能或者其他信息的当前GPU信息,并将收集好的当前GPU信息发送至BMC。然后,BMC便可以根据当前GPU信息对GPU进行监控。可见,本申请无需维护人员安装GPU的驱动和相关监控软件,简化了监控过程,提高了监控效率;而且,BMC可以定期自动获取GPU信息,实现自动监控GPU的状态,比较智能。本专利技术还提供了一种BMC监控GPU的系统、装置及计算机可读存储介质,与上述监控方法具有相同的有益效果。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的一种BMC监控GPU的方法的流程图;图2为本专利技术提供的一种BMC监控GPU的系统的结构示意图。具体实施方式本专利技术的核心是提供一种BMC监控GPU的方法、系统、装置及计算机可读存储介质,无需维护人员安装GPU的驱动和相关监控软件,简化了监控过程,提高了监控效率;而且,BMC可以定期自动获取GPU信息,实现自动监控GPU的状态,比较智能。为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参照图1,图1为本专利技术提供的一种BMC监控GPU的方法的流程图。该方法包括:步骤S1:服务器中的基板管理控制器BMC每隔预设时间发送读取指令,以便于服务器中的图形处理器GPU在接收到读取指令后收集当前GPU信息;需要说明的是,本申请中的预设和预先均是提前设置好的,只需要设置一次,除非根据实际情况修改,否则不需要重新设置。具体地,BMC(BaseboardManagementController,基板管理控制器)是服务器特有的管理控制器,其可以自动监控服务器的当前运行状态,如监控服务器中传感器的状态、访问BIOS配置或操作系统控制台信息等,并及时根据当前运行状态进行调控服务器。服务器中的GPU是一种专门用于图像运算工作的微处理器。为了实现BMC对GPU的监控,BMC每隔提前设置好的时间均会发送读取指令至GPU,也即定期发送读取指令至GPU。当GPU接收到读取指令后,开始收集自身的当前GPU信息,当前GPU信息不仅可以体现GPU的当前性能,还能体现GPU的其他非性能信息。当GPU收集完自身的当前GPU信息时,将收集的当前GPU信息发送至BMC。步骤S2:BMC根据当前GPU信息对GPU进行监控。具体地,当BMC接收到当前GPU信息后,根据接收的当前GPU信息对GPU进行监控。由于BMC定期发送读取指令至GPU,所以BMC可以周期性地监控GPU,从而及时发现GPU出现的问题,方便了维护人员的维护工作。比如,当当前GPU信息包括GPU的当前温度时,BMC根据GPU的当前温度对GPU进行监控的具体过程包括:BMC比较G本文档来自技高网...

【技术保护点】
1.一种BMC监控GPU的方法,其特征在于,包括:服务器中的基板管理控制器BMC每隔预设时间发送读取指令,以便于所述服务器中的图形处理器GPU在接收到所述读取指令后收集当前GPU信息;所述BMC根据所述当前GPU信息对所述GPU进行监控。

【技术特征摘要】
1.一种BMC监控GPU的方法,其特征在于,包括:服务器中的基板管理控制器BMC每隔预设时间发送读取指令,以便于所述服务器中的图形处理器GPU在接收到所述读取指令后收集当前GPU信息;所述BMC根据所述当前GPU信息对所述GPU进行监控。2.如权利要求1所述的方法,其特征在于,该方法还包括:所述BMC预先定义一个GPU结构体,将所述当前GPU信息保存至所述GPU结构体。3.如权利要求2所述的方法,其特征在于,该方法还包括:所述BMC在接收用户通过浏览器发送的访问请求后,将所述GPU结构体内的当前GPU信息显示于自身的web界面,以便于所述用户根据所述web界面的显示了解所述GPU的当前运行状态及当前健康状况。4.如权利要求1所述的方法,其特征在于,所述当前GPU信息包括所述GPU的厂商id和/或设备id和/或当前温度和/或当前功耗和/或当前内存错误次数。5.如权利要求4所述的方法,其特征在于,所述BMC根据所述当前GPU信息对所述GPU进行监控的过程具体为:所述BMC比较所述当前温度与预设温度和/或比较所述当前功耗与预设功耗和/或比较所述当前内存错误次数与预设次数,相应地,当所述当前温度大于所述预设温度时,将所述当前温度及温度比较结果均显示于...

【专利技术属性】
技术研发人员:范雪峰
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1