温度监控方法、系统、设备及介质技术方案

技术编号:36192756 阅读:15 留言:0更新日期:2022-12-31 21:12
本公开提供了一种温度监控方法、系统、设备及介质,涉及计算机技术领域,尤其涉及服务器机柜管理技术领域。实现方案为:分别获取至少一个服务器节点相应的至少一个节点温度,至少一个节点温度中的每个节点温度来源于相应服务器节点的基板管理控制器;基于至少一个节点温度中的最高节点温度,确定用于控制冷却液的进液流量的第一控制值,冷却液被泵入机柜以冷却至少一个服务器节点;以及基于第一控制值,使液冷分配单元对冷却液的进液流量进行控制。制。制。

【技术实现步骤摘要】
温度监控方法、系统、设备及介质


[0001]本公开涉及计算机
,尤其涉及服务器机柜管理
,具体涉及一种用于浸没式整机柜服务器的温度监控方法、装置、电子设备、计算机可读存储介质、计算机程序产品和浸没式整机柜服务器。

技术介绍

[0002]在当今的数据系统中,液冷技术相较于传统的风冷技术,是整机柜服务器提高能源利用效率的重要路径,也是整机柜服务器实现碳达峰、碳中和这一目标的必然选择。
[0003]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0004]本公开提供了一种用于浸没式整机柜服务器的温度监控方法、装置、电子设备、计算机可读存储介质、计算机程序产品和浸没式整机柜服务器。
[0005]根据本公开的一方面,提供了一种用于浸没式整机柜服务器的温度监控方法,应用于温度监控系统中的机柜管理单元,温度监控系统包括机柜管理单元和液冷分配单元,服务器包括机柜和置于机柜中的至少一个服务器节点,温度监控方法包括:分别获取至少一个服务器节点相应的至少一个节点温度,至少一个节点温度中的每个节点温度来源于相应服务器节点的基板管理控制器;基于至少一个节点温度中的最高节点温度,确定用于控制冷却液的进液流量的第一控制值,冷却液被泵入机柜以冷却至少一个服务器节点;以及基于第一控制值,使液冷分配单元对冷却液的进液流量进行控制。
[0006]根据本公开的另一方面,提供了一种用于浸没式整机柜服务器的温度监控系统,其中,服务器包括机柜和置于机柜中的至少一个服务器节点,温度监控系统包括机柜管理单元和液冷分配单元,其中,机柜管理单元被配置用于:分别获取至少一个服务器节点相应的至少一个节点温度,至少一个节点温度中的每个节点温度来源于相应服务器节点的基板管理控制器;以及基于至少一个节点温度中的最高节点温度,确定用于控制冷却液的进液流量的第一控制值,冷却液被泵入机柜以冷却至少一个服务器节点;以及液冷分配单元被配置用于基于第一控制值,对冷却液的进液流量进行控制。
[0007]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述用于浸没式整机柜服务器的温度监控方法。
[0008]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述用于浸没式整机柜服务器的温度监控方法。
[0009]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,计
算机程序在被处理器执行时实现上述用于浸没式整机柜服务器的温度监控方法。
[0010]根据本公开的另一方面,提供了一种浸没式整机柜服务器,包括上述用于浸没式整机柜服务器的温度监控系统。
[0011]根据本公开的一个或多个实施例,能够通过应用机柜管理单元对机柜内部的每个节点的温度进行读取,并基于每个节点温度,确定冷却液的进液流量控制值,并基于该控制值,通过液冷分配单元进行进液流量控制,从而避免浸没式整机柜服务器中局部节点过热的问题。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。
[0014]图1示出了根据本公开的实施例的用于浸没式整机柜服务器的温度监控方法的流程图;
[0015]图2示出了根据本公开的示例性实施例的用于浸没式整机柜服务器的温度监控系统的结构示意图;
[0016]图3示出了根据本公开的示例性实施例的用于浸没式整机柜服务器的温度监控系统的结构示意图;
[0017]图4示出了根据本公开的实施例的机柜管理单元与传感器单元之间的通信架构示意图;
[0018]图5示出了能够用于实现本公开的实施例的示例性电子设备的结构框图。
具体实施方式
[0019]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0020]在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个要素与另一要素区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。
[0021]在本公开中对各种所述示例的描述中所使用的术语只是为了描述特定示例的目的,而并非旨在进行限制。除非上下文另外明确地表明,如果不特意限定要素的数量,则该要素可以是一个也可以是多个。此外,本公开中所使用的术语“和/或”涵盖所列出的项目中的任何一个以及全部可能的组合方式。
[0022]相关技术中,浸没式整机柜服务器(以下简称为服务器)中的液冷体系,采取的设计方式为服务器节点集中嵌入在绝缘且导热性能优异的机柜中,液冷机房本地配置液冷分
配单元(Cooling Distribution Unit,CDU),通过机房本地的CDU单元实现对机房中的整机柜服务器进出液温度,进出液流量的监控。
[0023]这种方式仅能对进出液的温度进行检测,无法兼顾每个服务器节点,例如某个CPU靠近GPU,由于散热效果不好,就会导致局部温度远高于其他部分的温度,影响服务器性能。
[0024]下面将结合附图详细描述本公开的实施例。
[0025]对于一个浸没式整机柜服务器,其包括一个机柜和置于机柜中的至少一个服务器节点,其中,服务器节点例如可以包括CPU、GPU、网卡、存储卡等。为保证该服务器中每个服务器节点的正常运行,需要将冷却液泵入服务器的机柜,使冷却液对机柜中的每个服务器节点进行冷却。
[0026]根据本公开的实施例,如图1所示,提供了一种用于浸没式整机柜服务器的温度监控方法,应用于温度监控系统中的机柜管理单元,温度监控系统包括机柜管理单元和液冷分配单元,该方法包括:步骤S101、分别获取至少一个服务器节点相应的至少一个节点温度,至少一个节点温度中的每个节点温度来源于相应服务器节点的基板管理控制器;步骤S102、基于至少一个节点温度中的最高节点温度,确定用于控制冷却液的进液本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于浸没式整机柜服务器的温度监控方法,应用于温度监控系统中的机柜管理单元,所述温度监控系统包括所述机柜管理单元和液冷分配单元,所述服务器包括机柜和置于所述机柜中的至少一个服务器节点,所述方法包括:分别获取所述至少一个服务器节点相应的至少一个节点温度,所述至少一个节点温度中的每个节点温度来源于相应服务器节点的基板管理控制器;基于所述至少一个节点温度中的最高节点温度,确定用于控制冷却液的进液流量的第一控制值,所述冷却液被泵入所述机柜以冷却所述至少一个服务器节点;以及基于所述第一控制值,使所述液冷分配单元对所述冷却液的进液流量进行控制。2.根据权利要求1所示的方法,所述温度监控系统还包括传感器单元,所述方法还包括:获取来自于所述传感器单元的所述冷却液的当前进液温度;并且,所述基于所述至少一个节点温度中的最高节点温度,确定用于控制冷却液的进液流量的第一控制值包括:基于所述至少一个节点温度中的最高节点温度和所述当前进液温度,确定所述第一控制值。3.根据权利要求2所示的方法,其中,所述传感器单元中存储有所述冷却液的第一进液温度以及第一进液流量,所述第一进液温度和所述第一进液流量响应于相应传感器的实时检测而实时更新,所述方法还包括:定时获取所述至少一个节点温度以及所述第一进液温度,以基于所述至少一个节点温度和所述第一进液温度获取更新后的所述第一控制值;以及将更新后的所述第一控制值存储至所述传感器单元中,以供所述液冷分配单元从所述传感器单元中定时读取所述第一进液流量和更新后的所述第一控制值,并基于所述第一进液流量和更新后的所述第一控制值控制所述冷却液的进液流量。4.根据权利要求3所述的方法,其中,所述传感器单元中还存储有所述冷却液的至少一个第一传感数据,所述至少一个第一传感数据包括出液温度、出液流量、冷却液液位以及漏液状态信息中的至少一者,并且所述至少一个第一传感数据中的每个第一传感数据响应于相应传感器的实时检测而实时更新,所述方法还包括:从所述传感器单元中定时获取所述至少一个第一传感数据、所述第一进液温度和所述第一进液流量;基于所述至少一个第一传感数据、所述第一进液温度和所述第一进液流量,判断所述机柜的液冷环境是否存在异常;以及响应于所述机柜的液冷环境存在异常,向远程监控中心发送告警信息。5.根据权利要求4所述的方法,所述方法还包括:响应于接收到来自于所述远程监控中心的查询指令,从所述传感器单元中获取与所述查询指令相应的传感数据;以及将与所述查询指令相应的传感数据上传至所述远程监控中心。6.一种用于浸没式整机柜服务器的温度监控系统,其中,所述服务器包括机柜和置于所述机柜中的至少一个服务器节点,所述温度监控系统包括机柜管理单元和液冷分配单元,其中,
所述机柜管理单元被配置用于:分别获取所述至少一个服务器节点相应的至少一个节点温度,所述至少一个节点温度中的每个节点温度来源于相应服务器节点的基板管理控制器;以及基于所述至少一个节点温度中的最高节点温度,确定用于控制冷却液的进液流量的第一控制值,所述冷却液被泵入所述机柜以冷却所述至少一个服务器节点;以及所述...

【专利技术属性】
技术研发人员:李杨杨郑建武程冰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1