【技术实现步骤摘要】
一种GPU服务器的功耗控制方法、系统及相关组件
本申请涉及GPU服务器领域,特别涉及一种GPU服务器的功耗控制方法、系统及相关组件。
技术介绍
在AI、大数据、云计算时代,各行各业都在着力搭建高效率、低成本的数据管理、运行模式,以获取更大的投资回报率。所以,GPU(GraphicsProcessingUnit,图形处理器)服务器在AI浪潮中快速兴起,成为AI领域应用最广泛、投入产出比最优的异构加速计算解决方案。GPU服务器结合了GPU并行计算能力强和CPU逻辑控制的优势,根据实际应用场景的需求,满足计算单元、Cache、控制器等关键模块的配置。GPU服务器现有的技术方案中,由于GPU内部集成了大量的计算单元ALU,单颗GPU组件的功耗最高可达到约300W,在进行类似EDPP(ElectricalDevicePeakPower,电气设备峰值功率)这种特殊的测试时,瞬间功耗可以超过700W。若单颗GPU功耗过高,当配置多颗GPU时,系统总功耗可能超过单颗PSU的最大功耗,导致GPU服务器掉电;且GPU在进行高速并行计算时 ...
【技术保护点】
1.一种GPU服务器的功耗控制方法,其特征在于,所述GPU服务器包括PSU、PCH、CPU和GPU,所述PSU的alert信号线与所述PCH的GPIO接口连接,该功耗控制方法包括:/n按预设规则获取所述GPIO接口的电平状态;/n判断所述电平状态是否满足降频条件;/n若是,通过操作系统管理软件生成降频指令,以便对所述CPU和所述GPU进行降频处理。/n
【技术特征摘要】
1.一种GPU服务器的功耗控制方法,其特征在于,所述GPU服务器包括PSU、PCH、CPU和GPU,所述PSU的alert信号线与所述PCH的GPIO接口连接,该功耗控制方法包括:
按预设规则获取所述GPIO接口的电平状态;
判断所述电平状态是否满足降频条件;
若是,通过操作系统管理软件生成降频指令,以便对所述CPU和所述GPU进行降频处理。
2.根据权利要求1所述的功耗控制方法,其特征在于,所述按预设规则获取所述GPIO接口的电平状态的过程具体为:
通过中断获取所述GPIO接口的电平状态。
3.根据权利要求1所述的功耗控制方法,其特征在于,所述降频条件为所述电平状态为低电平状态。
4.根据权利要求1所述的功耗控制方法,其特征在于,所述通过操作系统管理软件生成降频指令,以便对所述CPU和所述GPU进行降频处理的过程具体为:
通过CPUpower工具和NVIDIA-SMI工具接收所述降频指令,然后分别通过所述CPUpower工具和所述NVIDIA-SMI工具对所述CPU和所述GPU进行降频处理。
5.根据权利要求1所述的功耗控制方法,其特征在于,该功耗控制方法还包括:
获取所述CPU和所述GPU各自对应的特性数据,所述特性数据包括CPU的目标频率值及所述GPU的目标频率值;
相应的,所述通过操作系统管理软件生成降频指令,以便对所述CP...
【专利技术属性】
技术研发人员:程世超,王鹏,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。