An embodiment of the invention discloses a method, a device and a computer readable storage medium for controlling the frequency reduction of GPU. The BMC obtains the temperature value of the GPU; determines whether the temperature value is more than the preset threshold value; when the temperature value exceeds the preset threshold, the temperature of the current GPU is higher, and if the measures are not taken in time, it may lead. When the GPU is damaged, at this time, BMC will input the level instruction to the GPU to achieve the reduced frequency of the GPU. When the frequency of GPU is reduced, its running speed will decline and the corresponding temperature growth rate will decrease, thus effectively controlling the increase of the GPU temperature and realizing the protection of the GPU. BMC control GPU reduction is an external protection method which is independent of the internal protection mechanism of GPU. It works together with the protection mechanism within the GPU, providing double insurance for GPU and maximizing the protection of GPU.
【技术实现步骤摘要】
一种控制GPU降频的方法、装置和计算机可读存储介质
本专利技术涉及服务器
,特别是涉及一种控制GPU降频的方法、装置和计算机可读存储介质。
技术介绍
图形处理单元(GraphicsProcessingUnit,GPU)又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器。随着人工智能(ArtificialIntelligence,AI)服务器应用的日益广泛,GPU作为AI服务器中价格较昂贵的硬件也在不断地被投入使用。如何能够最大限度的延长GPU的使用寿命和发挥GPU的性能,成为了一个可研究的话题。GPU温度是影响GPU的使用寿命和GPU性能的重要因素,当GPU温度过高时,会影响其工作性能,严重时会造成GPU损坏。现有技术中,在GPU内部设置有保护机制,当GPU温度过高时,该保护机制进行降频处理,以保护GPU。由于GPU的内部保护机制不透明,仅依靠GPU内部保护机制进行降频,在安全性上得不到把控。可见,如何提升GPU的安全性,是本领域技术人员亟待解决的问题。
技术实现思路
本专利技术实施例的目的是提供一种控制GPU降频的方法、装置和计算机可读存储介质,可以提升GPU的安全性。为解决上述技术问题,本专利技术实施例提供一种控制GPU降频的方法,包括:获取GPU的温度值;判断所述温度值是否超过预设阈值;当所述温度值超过所述预设阈值时,向所述GPU输入电平指令,以实现所述GPU的降频。可选的,还包括:判断所述温度值是否超过预设极限值;当所述温度值超过所述预设极限值时,执行系统掉电操 ...
【技术保护点】
1.一种控制GPU降频的方法,其特征在于,包括:获取GPU的温度值;判断所述温度值是否超过预设阈值;当所述温度值超过所述预设阈值时,向所述GPU输入电平指令,以实现所述GPU的降频。
【技术特征摘要】
1.一种控制GPU降频的方法,其特征在于,包括:获取GPU的温度值;判断所述温度值是否超过预设阈值;当所述温度值超过所述预设阈值时,向所述GPU输入电平指令,以实现所述GPU的降频。2.根据权利要求1所述的方法,其特征在于,还包括:判断所述温度值是否超过预设极限值;当所述温度值超过所述预设极限值时,执行系统掉电操作。3.根据权利要求1或2所述的方法,其特征在于,还包括:统计预设时间段内向所述GPU发送温度获取指令的总次数,以及温度值超过所述预设阈值的超温次数;当所述超温次数和所述总次数满足预设条件时,进行报警提示。4.根据权利要求3所述的方法,其特征在于,所述当所述超温次数和所述总次数满足预设条件时,进行报警提示包括:计算所述超温次数和所述总次数的比值;当所述比值超过预先设定的标准值时,进行报警提示。5.根据权利要求1所述的方法,其特征在于,所述向GPU发送温度获取指令包括:通过总线向所述GPU发送温度获取指令。6.一种控制GPU降频的装置...
【专利技术属性】
技术研发人员:韩增福,易凌鹰,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。