【技术实现步骤摘要】
本公开内容总体上涉及电子系统,并且尤其涉及用于控制计算机系统中的设备阵列内的可调节(throttlable)设备的系统和方法。
技术介绍
许多类型的电子设备以阵列形式组合。例如,单个刀片(blade)中心可能包括几个一个接着另一个排列的刀片服务器。电子设备操作的副产品是热量,而且因为电子设备阵列通常位于封闭区域内,所以由单个电子设备生成的热量会影响相邻的电子设备,且反之亦然。然而,许多电子设备对热量敏感,因此许多电子设备包括一个或多个风扇用来冷却这些设备。 当这些电子设备之一过热时,出现与这些设备阵列相关联的问题。过热可能是由于许多原因而导致的,但是一个设备过热的典型原因是冷却该特定设备的一个或者多个风扇出故障了。如果过热的设备是单独的,则过热可能不是严重的问题。然而,因为过热的设备处于其它发热设备阵列当中,所以过热问题加重了。一旦设备的温度升高到某一级别,则该设备可能出故障,或者在该设备内的防故障措施可能导致该设备停机。 虽然在设备阵列当中的特定设备的停机可能不是严重的问题,但是在其它情况下,如果设备正执行关键性的功能,则设备的故障(或者停机)是要避免的事件。因此,需要用于减少设备阵列中的相邻设备对特定过热设备的热效应的系统和方法。
技术实现思路
本专利技术的实施例解决了与电子系统有关的技术中的缺陷,并且提供了用于减少电子设备阵列中的相邻设备对过热设备的热效应的、新颖且非显而易见的方法和系统。电子设备阵列包括设备阵列中的至少一个可调节设备,以及连接到该至少一个可调节设备的管理模块。管理模块被配置为检测过热设备的过热,检测至少一个与该过热设备相邻并且 ...
【技术保护点】
一种用于减少电子设备阵列中相邻设备对过热设备的热效应的管理模块,包含:与该设备阵列中的至少一个可调节设备的连接,其中该管理模块被配置为:检测过热设备的过热;检测与该过热设备相邻并且在该设备阵列中的至少一个可调节设备; 以及调节该至少一个可调节设备。
【技术特征摘要】
US 2005-12-30 11/323,861中特别指出的单元和组合,实现和获得本发明的这些方面。应当理解上述一般说明以及下面的详细说明仅仅为示范和说明性的,而且不是对所要求保护的本发明的限制。附图说明并入并且构成这个说明书一部分的附图举例说明了本发明的实施例,而且它连同该描述一起用来说明本发明的原理。此处说明的实施例目前是优选的,然而应当理解,本发明不局限于所示出的精确配置和手段,其中图1是根据本发明的配置的计算机系统的框图;以及图2是根据本发明的配置、说明用于减少从相邻设备到过热设备的热量的方法的流程图。具体实施方式图1说明了电子设备12A-12E的阵列10,这些电子设备被配置为当电子设备12之一开始过热时、减少由阵列10生成的热量。通过调节没有过热的其它设备12中的至少一个来实现减少热量产生。 电子设备12不局限于特定类型。此外,电子设备12可以每个都是不同类型的设备。然而,在阵列10的某些方面中,每个电子设备12是附着于刀片中心的中平面(midplane)14的刀片服务器(在下文中,这些电子设备被称为服务器12),其中至少一个服务器12是可调节的。 在可以调节服务器12(即,减少功耗)的方式方面,可调节服务器12不受限制。例如,可以关闭服务器12中的某些部分,可以通过时钟调节将服务器12的计算部分置于低功率状态,和/或可以在服务器12可从电源中获得的电能数量方面对服务器12进行限制。 服务器12的阵列10可以包括管理模块16。管理模块16可以与服务器12相分离(如图所示),和/或管理模块16的一部分可以并入每个服务器12内。如果提供了多个管理模块16,则这些管理模块16可以相互之间进行通信,或者管理模块16可以独立地进行操作。 管理模块16进行特定服务器12B正变得过热并且需要降低温度的确定。已知有许多不同的确定特定服务器温度的方式,而且管理模块16不局限于任何可行的方式。例如,管理模块16可以采用传感器来确定在相对于服务器12的特定位置处的温度。其它示例包括读取服务器12内的CPU的温度和/或确定服务器12内的电源的温度。 一旦管理模块16做出了特定服务器12B正变得过热并且需要降低温度的确定,则管理模块16控制邻近该过热服务器12B的调节服务器12的处理。通过调节邻近该过热服务器12B的服务器12,可以减少在该过热服务器12B附近生成的热量,这可以停止或者减少在该过热服务器12B上的过热效应。 为了更显著地强调这个说明书中描述的某些功能单元的实现独立性,将这些功能单元标记为模块。例如,模块可以被实现为包含定制电路或者门阵列、诸如逻辑芯片之类的成品半导体、晶体管、或者其它分立元件的硬件电路。模块还可以用诸如现场可编程门阵列、可编程阵列逻辑、可编程逻辑设备等之类的可编程硬件设备实现。 模块还可以用由各种类型处理器执行的软件的形式实现。例如,可执行代码的标识模块可包含一个或多个计算机指令的物理或者逻辑块,它们例如可以被组织成对象、过程、或函数。虽然如此,但标识模块的可执行代码不必物理地位于一起,而是可以包含存储在不同位置中的不同指令,当这些指令逻辑地连接在一起时,就组成了模块并且实现该模块的规定目的。 可执行代码模块可以是单条指令、或者许多指令,而且甚至可以分布在几个不同代码段上、分布在不同的程序当中、并且跨越几个存储设备分布。类似地,操作数据可在模块内标识和说明,并且可以用任何适当的形式实现并且被组织在任何适当类型的数据结构内。该操作数据可以被集中为单个数据集,或者可以在包括遍及不同存储设备在内的不同位置上分布,而且可以至少部分地仅仅作为系统或者网络上的电子信号而存在。 图2说明了一个示范性处理,该处理用于减少在设备12的阵列10中相邻设备对过热设备的热效应。在某些情况下,在步骤110,该处理开始,并且在过热服务器12B已经用尽了任何可被执行用以减少由服务器12B生成的热量的自我调整动作之后,继续到步骤120。例如,如果服务器12B是可调节的,则服务器12B可以向下调节,和/或可以使服务器12B中的某些部分停机,以减少由过热服务器12B本身生成的热量。 然而,可能有这样的情况,其中可以由过热服务器12B采取的动作未能在该处理继续到步骤120之前采取。例如,虽然过热服务器12B也许能调节和/或关闭服务器12B中的某些部分,但是不期望采取这些动作,因为这样做将会损害服务器12B的关键功能。在这种情况下,例如,所期望的是其它服务器12、而不是过热服务器12B采取动作来减少所生成的热量。 在其它情况下,服务器12B本身不能采取措施来减少由过热服务器12B生成的热量,这是因为服务器12B是不可调节的。在这些情况下,该处理继续到步骤120。 在步骤130,进行是否需要采取另外的动作以减少服务器12的阵列10中相邻设备对过热服务器12B的热效应的确定。进行这个确定的方式不局限于特定的措施和/或情况。例如,可以在规定时间长度之后过热服务器已经高于特定温度后进行该确定。在某些方面中,在过热服务器12B的温度已经升高到超过规定温度之后进行这个确定。 在步骤140,在做出了需要采取另外的行动的确定之后,做出有关是否有任何相邻的可调节服务器12的确定,并且本方法在做出这个确定的方式方面不受限制。例如,可以由服务器12与过热服务器12B的相对物理邻近来定义该相邻服务器12。 另外,该确定可以考虑热量如何从一个服务器12传递到过热服务器12B。例如,在过热服务器12B周围的气流模式可以规定即使与在过热服务器12B下游的下游服务器12相比、在过热服务器12B上游的上游服务器12在物理上更加远离过热服务器12B,在过热服务器12B上游的上游服务器也被认为是“相邻”的,而在过热服务器12B下游的下游服务器12可以被认为是不相邻的。不同类型的传热示例包括产生气流(即,强制对流)和热空气上升(即,自由对流)的风扇。 如先前所述,存在许多类型的可调节服务器12,而且该方法不局限于特定类型的可调节服务器12。然而,该方法可能考虑可调节服务器12在这个特定时间上是否是可调节...
【专利技术属性】
技术研发人员:基思M坎贝尔,唐纳德E约翰逊,杰弗瑞M弗兰克,布鲁克斯约翰斯顿,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。