电子机架及向电子机架提供液体冷却的方法技术

技术编号:30146587 阅读:23 留言:0更新日期:2021-09-25 14:51
本公开涉及一种电子机架,以及向电子机架提供液体冷却的方法。电子机架包括堆叠布置的刀片服务器的阵列。每个刀片服务器包括一个或多个服务器,以及每个服务器包括一个或多个处理器以提供数据处理服务。电子机架包括冷却剂分配单元(CDU)和机架管理单元(RMU)。CDU向处理器提供冷却液并接收携带来自处理器的热量的冷却液。CDU包括液体泵以泵送冷却液。RMU被配置为管理电子机架内的组件,诸如CDU等的操作。RMU包括控制逻辑,以基于一个或多个参数以及加速服务器和主机服务器的温度和功耗之间的关联,确定最佳泵速,以最小化泵、加速服务器和主机服务器的总功耗。然后,RMU基于最佳泵速控制液体泵。控制液体泵。控制液体泵。

【技术实现步骤摘要】
电子机架及向电子机架提供液体冷却的方法


[0001]本专利技术的实施例一般涉及数据中心。更特别地,本专利技术的实施例涉及数据中心的异构计算电子机架中的液体冷却解决方案的最佳控制。

技术介绍

[0002]高功率密度芯片和处理器的热管理是关键问题,尤其是随着诸如CPU(中央处理单元)和GPU(图形处理单元)的高端芯片的功率密度的增加。在冷却系统设计中使用冷却设备,用于通过排除由芯片生成的热量维持芯片的热状况。如果温度超过热规范的限制,则芯片可能不正常运转,并且可能发生节流。另外,通过在芯片工作时为其提供适当或更好的热状况,可以实现更好的性能或更少的功耗。
[0003]通过诸如数据中心GPU的高功率密度处理器使得能够实现高性能机器学习计算。常规的空气冷却解决方案正在努力处理此类GPU机架中的热管理挑战。相反,冷却板液体冷却解决方案提供好得多的冷却性能并且节省冷却基础设施中的能量消耗。

技术实现思路

[0004]本申请公开了一种数据中心的电子机架,一种用于确定液体泵的最佳泵速以向数据中心的电子机架提供液体冷却的方法以及一种非暂时本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据中心的电子机架,包括:多个刀片服务器,所述多个刀片服务器堆叠地布置,每个刀片服务器包括一个或多个主机服务器和一个或多个加速服务器,每个服务器包括一个或多个处理器以提供数据处理服务;冷却剂分配单元CDU,所述CDU用于向所述处理器供应冷却液并接收携带从所述处理器交换的热量的所述冷却液,其中所述CDU包括液体泵以泵送所述冷却液以及泵控制器以控制所述液体泵的泵速;以及机架管理单元RMU,所述RMU耦接到所述刀片服务器和所述CDU,其中所述RMU包括控制逻辑,所述控制逻辑被配置为:确定所述一个或多个加速服务器和所述一个或多个主机服务器的处理器操作温度与功耗之间的关联;获得与所述电子机架的操作相关联的一个或多个参数;基于所述一个或多个参数以及所述加速服务器和所述主机服务器的处理器操作温度与功耗之间的关联确定泵速,以及基于确定的所述泵速,经由所述泵控制器控制所述液体泵的泵速。2.如权利要求1所述的电子机架,其中所述一个或多个加速服务器包括一个或多个图形处理单元GPU,以及所述一个或多个主机服务器包括一个或多个中央处理单元CPU。3.如权利要求1所述的电子机架,其中为了确定所述加速服务器和所述主机服务器的处理器操作温度与功耗之间的关联,所述控制逻辑还用于:确定在所述主机服务器的第一使用率下的所述主机服务器的处理器操作温度与功耗之间的第一关联;以及确定在所述加速服务器的第二使用率下的所述加速服务器的处理器操作温度与功耗之间的第二关联。4.如权利要求1所述的电子机架,其中为了确定所述泵速,所述控制逻辑用于:基于所述一个或多个参数和所述液体泵的泵速优化目标函数,其中优化所述目标函数包括最小化所述目标函数的结果。5.如权利要求1所述的电子机架,其中为了获得所述一个或多个参数,所述控制逻辑用于:发起包括计算任务的执行的委托测试的执行;以及基于在所述委托测试期间的所述电子机架的操作收集所述一个或多个参数。6.如权利要求5所述的电子机架,其中在所述委托测试期间收集的参数指示所述电子机架的初始状况。7.如权利要求5所述的电子机架,其中在所述委托测试期间收集的所述一个或多个参数包括泵速、耦接到所述加速服务器和所述主机服务器的处理器的冷却板的热电阻、所述冷却液的...

【专利技术属性】
技术研发人员:邵帅高天翼
申请(专利权)人:百度美国有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1