用于数据中心电子机架的液体冷却的泄漏检测和响应系统技术方案

技术编号:22786590 阅读:18 留言:0更新日期:2019-12-11 05:28
电子机架包括机架歧管和服务器刀片,其中,机架歧管具有机架液体供应线和机架液体返回线,服务器刀片以堆叠布置。每个服务器刀片包括冷板和服务器液体分配回路,以及泄漏检测器,泄漏检测器配置成检测分配至服务器刀片的冷却液体的泄漏。电子机架还包括与服务器刀片对应的服务器FCD和联接至服务器FCD和服务器刀片的泄漏检测器的RMC单元。在一个实施方式中,响应于从第一服务器刀片的第一泄漏检测器接收的指示第一服务器刀片内存在泄漏的信号,RMC单元配置成向第一服务器FCD发送控制信号以减少待分配至第一服务器刀片的冷却液体的量或使完全液体绕开。

Leak detection and response system for liquid cooling of data center electronic racks

The electronic rack includes a rack manifold and a server blade, wherein the rack manifold has a rack liquid supply line and a rack liquid return line, and the server blades are arranged in a stacking manner. Each server blade includes a cold plate and a server liquid distribution circuit, as well as a leakage detector configured to detect leakage of the cooling liquid distributed to the server blade. The electronic rack also includes a server FCD corresponding to the server blade and an RMC unit connected to the server FCD and the leak detector of the server blade. In one embodiment, in response to a signal received from the first leak detector of the first server blade indicating that there is a leak in the first server blade, the RMC unit is configured to send a control signal to the first server FCD to reduce the amount of cooling liquid to be allocated to the first server blade or to bypass the full liquid.

【技术实现步骤摘要】
用于数据中心电子机架的液体冷却的泄漏检测和响应系统
本专利技术的实施方式总体上涉及数据中心。更具体地,本专利技术的实施方式涉及用于数据中心中的电子机架的液体冷却的液体分配单元设计。
技术介绍
散热是计算机系统和数据中心设计的重要因素。高性能电子组件(诸如,封装在服务器内部的高性能处理器)的数目稳步增加,从而使服务器的常规操作期间产生和消散的热量增加。如果允许服务器运行的环境随着时间而升高温度,则数据中心内使用的服务器的可靠性降低。保持合适的热环境对于数据中心中的这些服务器的正常运行以及服务器性能和寿命来说是至关重要的。这需要更有效和高效的散热解决方案,特别是在冷却这些高性能服务器的情况下尤其如此。功率密集型处理器能够实现诸如深度学习的密集计算方案。具有这种处理器(即,高功率中央处理单元(CPU)和/或通用或图形处理单元(GPU))的电子服务器具有每体积空间的非常高的功率密度。液体冷却是针对高功率密度的合适的热管理解决方案。在液体冷却中,歧管被用于经由主入口端口/主出口端口和流体子端口分配和调节流体。主入口端口和主出口端口连接至外部冷却源,并且子端口与服务器回路或冷却设备回路连接。流体分配歧管是一项成熟技术;然而,大部分传统歧管设计在一些应用场景中效率不高。在液体冷却可以作为成熟的方案应用并在数据中心中规模采用之前,主要挑战之一是可靠性。可靠性问题为流体泄漏。存在用于改善液体冷却系统可靠性的多种方法,诸如改善产品质量、开发组件测试程序和标准(软管连接器、歧管等)、流体选择标准、材料选择标准等。然而,仍然经常可能发生泄漏,并且缺乏有效的机构来降低液体泄漏的风险。
技术实现思路
根据本申请的一方面,提供了一种电子机架,其包括:机架歧管,所述机架歧管具有机架液体供应线和机架液体返回线,所述机架液体供应线从冷却液体源接收冷却液体,所述机架液体返回线使较暖液体返回到所述冷却液体源;多个服务器刀片,所述多个服务器刀片堆叠布置,其中,所述服务器刀片中的每个包括一个或多个冷板和服务器液体分配回路,所述一个或多个冷板与一个或多个信息技术(IT)组件相关联,所述服务器液体分配回路从所述机架歧管接收所述冷却液体并将所述冷却液体分配至所述冷板以交换由所述IT组件产生的热,从而将所述冷却液体转变成所述较暖液体,其中,所述服务器刀片中的每个还包括泄漏检测器,所述泄漏检测器配置成检测分配至所述服务器刀片的所述冷却液体的泄漏;多对服务器液体供应线和服务器液体返回线,每对与所述服务器刀片中的一个对应,其中,所述服务器液体供应线和所述服务器液体返回线联接在所述机架歧管与所述服务器刀片的所述服务器液体分配回路之间;多个服务器流控制设备(FCD),每个服务器流控制设备与多对所述服务器液体供应线和所述服务器液体返回线中的一个对应,所述多个服务器流控制设备包括联接至第一服务器刀片的、成对的第一服务器液体供应线和第一服务器液体返回线的第一服务器FCD;机架管理控制器(RMC)单元,所述机架管理控制器单元联接至所述服务器FCD和所述服务器刀片的泄漏检测器,其中,所述RMC配置成响应于从所述第一服务器刀片的第一泄漏检测器接收的指示所述第一服务器刀片内存在液体泄漏的信号,向所述第一服务器FCD发送控制信号以减少分配至所述第一服务器刀片的所述冷却液体的量。根据本申请的另一方面,提供了一种数据中心的电子机架,其包括:机架歧管,所述机架歧管具有机架液体供应线和机架液体返回线,所述机架液体供应线从冷却液体源接收冷却液体,所述机架液体返回线使较暖液体返回到所述冷却液体源;多个服务器刀片,所述多个服务器刀片堆叠布置,其中,所述服务器刀片中的每个包括一个或多个冷板和服务器液体分配回路,所述一个或多个冷板与一个或多个信息技术(IT)组件相关联,所述服务器液体分配回路从所述机架歧管接收所述冷却液体并将所述冷却液体分配至所述冷板以交换由所述IT组件产生的热,从而将所述冷却液体转变成所述较暖液体,其中,所述服务器刀片中的至少一个还包括泄漏检测器,所述泄漏检测器配置成检测分配至所述服务器刀片的所述冷却液体的泄漏;机架流控制设备(FCD),所述机架流控制设备联接至所述机架液体供应线和所述机架液体返回线;以及机架管理控制器(RMC)单元,所述机架管理控制器单元联接至所述机架FCD和所述服务器刀片中的每个服务器刀片的所述泄漏检测器,其中,所述RMC配置成响应于从任何所述服务器刀片中的泄漏检测器接收的指示存在液体泄漏的信号,向所述机架FCD发送控制信号以减少到达所述服务器刀片的所述冷却液体的量。附图说明本专利技术的实施方式在附图的各图中以举例而非限制的方式示出,附图中的相同的参考数字指代相似的元件。图1是示出根据一个实施方式的数据中心设施的示例的框图。图2是示出根据一个实施方式的电子机架的示例的框图。图3是示出根据一个实施方式的冷板配置的示例的框图。图4A至图4B是示出根据某些实施方式的电子机架的示例的框图。图5是示出根据一个实施方式的可以实现为服务器刀片的一部分的冷却模块的示例的框图。具体实施方式将参考以下所讨论的细节来描述本专利技术的各种实施方式和方面,并且附图将示出所述各种实施方式。下列描述和附图是对本专利技术的说明,而不应当解释为限制本专利技术。描述了许多特定细节以提供对本专利技术的各种实施方式的全面理解。然而,在某些情况下,并未描述众所周知的或常规的细节以提供对本专利技术的实施方式的简洁讨论。本说明书中对“一个实施方式”或“实施方式”的提及意味着结合该实施方式所描述的特定特征、结构或特性可以包括在本专利技术的至少一个实施方式中。短语“在一个实施方式中”在本说明书中各个地方的出现不必全部指同一实施方式。本专利技术的实施方式集中在用于服务器液体冷却的泄漏响应设计。它提供了液体泄漏响应的基本构思,包括机械和热设计、控制设计以及信息技术(IT)响应设计。基本上,该概念是通过使用旁路回路来切断或转移供应至已经泄漏的冷却回路或冷却模块的流体。旁路回路的功能是绕过冷却回路/冷却模块。可以在机架级和/或服务器级实现旁路机构。根据本专利技术的一个方面,电子机架包括具有机架液体供应线和机架液体返回线的机架歧管。机架液体供应线配置成从冷却液体源接收冷却液体。机架液体返回线配置成使携带从电子机架的服务器交换的热量的较暖液体返回到冷却液体源。电子机架还包括以堆叠布置的多个服务器刀片。服务器刀片中的每个包括一个或多个冷板和服务器液体分配回路,一个或多个冷板与一个或多个IT组件(例如,处理器、存储器和/或存储储设备)相关联,服务器液体分配回路从机架歧管接收冷却液体并将冷却液体分配至冷板以交换由IT组件产生的热量。每个服务器刀片还包括配置成检测分配至服务器刀片的冷却液体的泄漏的泄漏检测器。电子机架还包括多对服务器液体供应线和服务器液体返回线。每对服务器液体供应线和服务器液体返回线与服务器刀片中的一个对应。服务器液体供应线和服务器液体返回线联接在机架歧管与服务本文档来自技高网
...

【技术保护点】
1.电子机架,包括:/n机架歧管,所述机架歧管具有机架液体供应线和机架液体返回线,所述机架液体供应线从冷却液体源接收冷却液体,所述机架液体返回线使较暖液体返回到所述冷却液体源;/n多个服务器刀片,所述多个服务器刀片堆叠布置,其中,所述服务器刀片中的每个包括一个或多个冷板和服务器液体分配回路,所述一个或多个冷板与一个或多个信息技术组件相关联,所述服务器液体分配回路从所述机架歧管接收所述冷却液体并将所述冷却液体分配至所述冷板以交换由所述信息技术组件产生的热,从而将所述冷却液体转变成所述较暖液体,其中,所述服务器刀片中的每个还包括泄漏检测器,所述泄漏检测器配置成检测分配至所述服务器刀片的所述冷却液体的泄漏;/n多对服务器液体供应线和服务器液体返回线,每对与所述服务器刀片中的一个对应,其中,所述服务器液体供应线和所述服务器液体返回线联接在所述机架歧管与所述服务器刀片的所述服务器液体分配回路之间;/n多个服务器流控制设备,每个服务器流控制设备与多对所述服务器液体供应线和所述服务器液体返回线中的一个对应,所述多个服务器流控制设备包括联接至第一服务器刀片的、成对的第一服务器液体供应线和第一服务器液体返回线的第一服务器流控制设备;/n机架管理控制器单元,所述机架管理控制器单元联接至所述服务器流控制设备和所述服务器刀片的泄漏检测器,其中,所述机架管理控制器单元配置成响应于从所述第一服务器刀片的第一泄漏检测器接收的指示所述第一服务器刀片内存在液体泄漏的信号,向所述第一服务器流控制设备发送控制信号以减少分配至所述第一服务器刀片的所述冷却液体的量。/n...

【技术特征摘要】
20180604 US 15/997,4281.电子机架,包括:
机架歧管,所述机架歧管具有机架液体供应线和机架液体返回线,所述机架液体供应线从冷却液体源接收冷却液体,所述机架液体返回线使较暖液体返回到所述冷却液体源;
多个服务器刀片,所述多个服务器刀片堆叠布置,其中,所述服务器刀片中的每个包括一个或多个冷板和服务器液体分配回路,所述一个或多个冷板与一个或多个信息技术组件相关联,所述服务器液体分配回路从所述机架歧管接收所述冷却液体并将所述冷却液体分配至所述冷板以交换由所述信息技术组件产生的热,从而将所述冷却液体转变成所述较暖液体,其中,所述服务器刀片中的每个还包括泄漏检测器,所述泄漏检测器配置成检测分配至所述服务器刀片的所述冷却液体的泄漏;
多对服务器液体供应线和服务器液体返回线,每对与所述服务器刀片中的一个对应,其中,所述服务器液体供应线和所述服务器液体返回线联接在所述机架歧管与所述服务器刀片的所述服务器液体分配回路之间;
多个服务器流控制设备,每个服务器流控制设备与多对所述服务器液体供应线和所述服务器液体返回线中的一个对应,所述多个服务器流控制设备包括联接至第一服务器刀片的、成对的第一服务器液体供应线和第一服务器液体返回线的第一服务器流控制设备;
机架管理控制器单元,所述机架管理控制器单元联接至所述服务器流控制设备和所述服务器刀片的泄漏检测器,其中,所述机架管理控制器单元配置成响应于从所述第一服务器刀片的第一泄漏检测器接收的指示所述第一服务器刀片内存在液体泄漏的信号,向所述第一服务器流控制设备发送控制信号以减少分配至所述第一服务器刀片的所述冷却液体的量。


2.根据权利要求1所述的电子机架,其中,所述第一服务器流控制设备配置成阻挡待分配至所述第一服务器刀片的第一液体分配回路的基本全部冷却液体。


3.根据权利要求2所述的电子机架,其中,所述第一服务器流控制设备配置成绕过所述第一服务器刀片的所述第一液体分配回路、将所述冷却液体从所述第一服务器液体供应线转移至所述第一服务器液体返回线。


4.根据权利要求1所述的电子机架,其中,每个服务器刀片还包括设置在所述服务器液体供应线上的供应液体压力传感器,以及其中,所述机架管理控制器单元配置成响应于从第二服务器刀片的供应液体压力传感器接收的指示所述第二服务器刀片的第二服务器液体供应线的液体压力降低至预定阈值以下的信号,使得所述第二服务器刀片的第二服务器流控制设备减少待分配至所述第二服务器液体供应线的所述冷却液体的量。


5.根据权利要求4所述的电子机架,其中,每个服务器刀片还包括设置在所述服务器返回供应线上的返回液体压力传感器,以及其中所述机架管理控制器单元配置成响应于从第二服务器刀片的返回液体压力传感器接收的指示所述第二服务器刀片的第二服务器液体返回线的液体压力降低至预定阈值以下的信号,使得所述第二服务器刀片的第二服务器流控制设备减少待分配至所述第二服务器液体供应线的所述冷却液体的量。


6.根据权利要求1所述的电子机架,还包括联接至所述机架液体供应线的机架流控制设备,其中,所述机架流控制设备配置成控制待分配至所述服务器刀片的所述冷却液体的量。


7.根据权利要求6所述的电子机架,其中,所述机架流控制设备配置成响应于从所述机架管理控制器单元接收的命令,阻挡大量的所述冷却液体到达所述服务器刀片。


8.根据权利要求7所述的电子机架,其中,所述机架流控制设备配置成绕过所述服务器刀片、将大量的所述冷却液体从所述机架液体供应线转移至所述机架液体返回线。


9.根据权利要求6所述的电子机架,还包括第一机架液体压力传感器,所述第一机架液体压力传感器联接至所述机架液体供应线以感测所述机架液体供应线内的液体压力,其中,响应于从所述第一机架液体压力传感器接收指示所述液体压力降低至第一预定阈值以下的第一信号,所述机架管理控制器单元激活所述机架流控制设备以减少到达所述服务器刀片的所述冷却液体的量。


10.根据权利要求9所述的电子机架,还包括第二机架液体压力传感器,所述第二机架液体压力传感器联接至所述机架液体返回线以感测所述机架液体返回线内的液体压力,其中,响应于从所述第二机架液体压力传感器接收指示所述液体压力降低至第二预定阈值以下的第二信号,所述机架管理控制器单元激活所述机架流控制设备以减少到达所述服务器刀片的所述冷却液体的量。

...

【专利技术属性】
技术研发人员:高天翼
申请(专利权)人:百度美国有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1