刀片服务器的散热控制系统和方法技术方案

技术编号:15541489 阅读:96 留言:0更新日期:2017-06-05 10:52
刀片服务器的散热控制方法,包括步骤:(a)管理节点根据风扇的型号绘制每个风扇的风压风量的特性曲线;(b)针对每个计算节点,管理节点依据计算节点的物理位置、风扇的物理位置和风扇的特性曲线,计算出每个风扇对计算节点的散热贡献值;(c)当某个计算节点的负载增大导致其温度升高时,管理节点依据各风扇对计算节点的散热贡献值来按比例调节各个风扇的转速,使相关的风扇共同作用形成散热的合力,从而加大计算节点的风量,并且单个风扇的调节量相对地变小;以及,(d)当某个计算节点的负载减少时,管理节点会依据各风扇对计算节点的散热贡献值来采取与步骤(c)相反的操作,从而减小计算节点的风量,并且单个风扇的调节量相对地变小。

Cooling control system and method for blade server

Cooling control method, blade server comprises the steps of: (a) management node according to characteristic curve of fan type drawing each fan pressure volume; (b) for each computing node, the characteristic curve of the management node according to the calculated physical location, node's physical location and fan fan, calculate each fan for heat contribution calculation of the node value; (c) when a computing node load increases due to the increased temperature, according to adjust the management node of each fan in proportion to the speed of the fan for cooling with calculation of the node value, the interaction force related to the fan to form heat dissipation, thereby increasing the computing node volume, and adjust the amount of a single fan becomes relatively small; and (d) when the load is a compute node node will decrease when the management on the basis of the fan for heat calculation node value contribution To take actions contrary to step (c), thereby reducing the air volume of the calculation node, and the regulation of a single fan is relatively smaller.

【技术实现步骤摘要】
刀片服务器的散热控制系统和方法
本专利技术涉及散热控制系统和方法,尤其涉及刀片服务器的散热控制系统和方法。
技术介绍
互联网技术正在飞速发展,作为网络的核心组成部分,服务器的性能是网络服务质量的重要指标。刀片服务器正是适应目前互联网的发展而出现的,刀片服务器所有的主板可以连接起来提供高速的网络环境,共享资源。同时,每个刀片都可内置监视器和管理工具软件,配置一台高密度服务器就可以解决一台到一百台服务器的管理问题,如果需要增加或者删除集群中的服务器,只要插入或拔出一块板即可,将维护时间减少到最小。所谓刀片服务器是指在标准高度的机架式机箱内可插装多个卡式的服务器单元,实现高可用和高密度。每一块“刀片”实际上就是一块系统主板。它们可以通过“板载”硬盘启动自己的操作系统,类似于一个个独立的服务器,在这种模式下,每一块母板运行自己的系统,服务于指定的不同用户群,相互之间没有关联。不过,管理员可以使用系统软件将这些母板集合成一个服务器集群。在集群模式下,所有的母板可以连接起来提供高速的网络环境,并同时共享资源,为相同的用户群服务。在集群中插入新的“刀片”,就可以提高整体性能。不过,由于每块“刀片”都是热插拔的,因而系统可以轻松地进行替换,并且将维护时间减少到最小。如前所述,由于其结构所限,刀片服务器的散热一直是个较为严重的问题。虽然始终在采取不同的手段来解决这个问题,例如在设计中采用低功耗的处理器等,但是还有待进一步优化散热效果,工程技术人员仍需探索新的散热控制手段,以获得更优良的散热效果。
技术实现思路
本专利技术目的之一是提供一种刀片服务器的散热控制方法,以获得更优良的散热效果,包括对风扇系统进行精准调节,以及能够在风扇出现故障时重新调整风扇系统的有效输出。本专利技术之另一目的是提供一种刀片服务器的散热控制系统,以获得更优良的散热效果,包括能够对风扇系统精准调节,以及能够在风扇出现故障时重新调整风扇系统的有效输出。由此,本专利技术提供一种刀片服务器的散热控制方法,其中,所述刀片服务器包括多个计算节点、管理节点和风扇系统,所述风扇系统包含多个风扇,所述管理节点与所述计算节点以及所述管理节点所述风扇系统之间均通过管理总线相连,所述方法包括如下步骤:(a)所述管理节点根据风扇的型号绘制每个风扇的风压风量的特性曲线;(b)针对每个计算节点,所述管理节点依据该计算节点的物理位置、风扇的物理位置和风扇的特性曲线,计算出每个风扇对该计算节点的散热贡献值;(c)当某个计算节点的负载增大导致其温度升高时,所述管理节点通过所述管理总线就会得到该计算节点的负载和温度变化的信息,之后,所述管理节点依据各风扇对该计算节点的散热贡献值来按比例调节各个风扇的转速,使相关的风扇共同作用形成散热的合力,以实现相关风扇的精准调节,从而加大用于所述计算节点的风量,并且单个风扇的调节量相对地变小;以及,(d)当某个计算节点的负载减少时,所述管理节点会依据各风扇对该计算节点的散热贡献值来采取与步骤(c)相反的操作,从而减小用于所述计算节点的风量,并且单个风扇的调节量相对地变小。作为优选方式,所述刀片服务器的散热控制方法,还包括如下步骤:当某一个风扇发生故障并得到所述管理节点的确定后,所述管理节点将重复步骤(a)和步骤(b),得到新的每个风扇对计算节点的散热贡献值,并依此进行风扇的调节控制。作为优选方式,所述刀片服务器的散热控制方法还包括如下步骤:所述管理节点的网络传输模块将所述管理节点所获得的数据以无线传输的方式传递至操作人员的手机。作为优选方式,所述刀片服务器的散热控制方法还包括如下步骤:当出现风扇故障,或者在散热达到散热危险阈值前,所述管理节点的报警器能够以声音和/或光的形式发出警报,以提醒操作人员及时进行处理。本专利技术还提供一种刀片服务器的散热控制系统,包括:多个计算节点,所述计算节点是所述刀片服务器中的监测点;管理节点,所述管理节点是散热控制系统的控制器;以及风扇系统,所述风扇系统包含多个风扇,其中,所述管理节点与所述计算节点以及所述管理节点所述风扇系统之间均通过管理总线相连,所述管理节点通过所述管理总线从所述计算节点读取所述计算节点当前的计算负载和环境温度,也能够发送指令至所述计算节点来调节所述计算节点的负载量以控制所述计算节点的功耗,进一步控制其散热量,并且所述管理节点通过所述管理总线可以获取每个风扇的转速信息,也能够发送指令至每个风扇来调节其转速;并且,所述管理节点根据风扇的型号绘制每个风扇的风压风量的特性曲线,针对每个计算节点,所述管理节点依据该计算节点的物理位置、风扇的物理位置和风扇的特性曲线,计算出每个风扇对该计算节点的散热贡献值,并且,当某个计算节点的负载变化而导致其温度变化时,所述管理节点通过所述管理总线就会得到该计算节点的负载和温度变化的信息,之后,所述管理节点依据各风扇对该计算节点的散热贡献值来按比例调节各个风扇的转速,使相关的风扇共同作用形成散热的合力,以实现相关风扇的精准调节,从而改变用于所述计算节点的风量,并且单个风扇的调节量相对地变小。作为优选方式,所述管理节点能够确定某一个风扇是否发生故障,如确定某一个风扇是否发生故障,则所述管理节点将重复根据风扇的型号绘制每个风扇的风压风量的特性曲线,针对每个计算节点,所述管理节点依据该计算节点的物理位置、风扇的物理位置和风扇的特性曲线,计算出每个风扇对该计算节点的散热贡献值,得到新的每个风扇对计算节点的散热贡献值,并依据各风扇对该计算节点的新的散热贡献值来按比例调节各个风扇的转速,使相关的风扇共同作用形成散热的合力,以实现相关风扇的精准调节。作为优选方式,所述管理节点包括网络传输模块,用于将所述管理节点所获得的数据以无线传输的方式传递至操作人员的手机。作为优选方式,所述管理节点包括报警器,当出现风扇故障,或者在散热达到散热危险阈值前,所述报警器能够以声音和/或光的形式发出警报,以提醒操作人员及时进行处理。在刀片服务器中,每个计算节点的计算任务具有独立性,其功耗情况和发热量也具有相对的独立性,因而需要准确的散热控制方法对每个计算节点实现精确的调节,以便在提供需要的散热风量的同时减少多余的风扇功耗。另外,刀片式服务器的密度越来越大,相同体积的设备内包含的计算节点越来越多,而与此同时,散热系统所包含的风扇个数并不是按此规律同步增加,单风扇与单计算节点之间并不存在一一对应的关系。相比于现有技术,本专利技术所提供的应用于刀片服务器的散热控制系统和方法具有如下优点:(1)当刀片服务器系统内的某个计算节点因负载变动导致温度变化时,管理节点依据相关的风扇对该计算节点的散热贡献值按比例来调节各个风扇的转速,使相关的风扇共同作用形成散热的合力,以实现对相关风扇的精准调节,避免仅仅调节单个风扇所带来的单风扇转速的过大波动;(2)当某个风扇发生故障时,管理节点针对计算节点的散热需要,只需根据新的散热贡献值来按比例调节相关的风扇,从而能够消除因该风扇故障所带来的危险,并且能够增大了对风扇的故障容错能力。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅用于解释本实专利技术的构思。图1是本专利技术的刀片服务器的散热控制方法的流本文档来自技高网...
刀片服务器的散热控制系统和方法

【技术保护点】
一种刀片服务器的散热控制方法,其中,所述刀片服务器包括多个计算节点、管理节点和风扇系统,所述风扇系统包含多个风扇,所述管理节点与所述计算节点以及所述管理节点所述风扇系统之间均通过管理总线相连,所述方法包括如下步骤:(a)所述管理节点根据风扇的型号绘制每个风扇的风压风量的特性曲线;(b)针对每个计算节点,所述管理节点依据该计算节点的物理位置、风扇的物理位置和风扇的特性曲线,计算出每个风扇对该计算节点的散热贡献值;(c)当某个计算节点的负载增大导致其温度升高时,所述管理节点通过所述管理总线就会得到该计算节点的负载和温度变化的信息,之后,所述管理节点依据各风扇对该计算节点的散热贡献值来按比例调节各个风扇的转速,使相关的风扇共同作用形成散热的合力,以实现相关风扇的精准调节,从而加大用于所述计算节点的风量,并且单个风扇的调节量相对地变小;以及(d)当某个计算节点的负载减少时,所述管理节点会依据各风扇对该计算节点的散热贡献值来采取与步骤(c)相反的操作,从而减小用于所述计算节点的风量,并且单个风扇的调节量相对地变小。

【技术特征摘要】
1.一种刀片服务器的散热控制方法,其中,所述刀片服务器包括多个计算节点、管理节点和风扇系统,所述风扇系统包含多个风扇,所述管理节点与所述计算节点以及所述管理节点所述风扇系统之间均通过管理总线相连,所述方法包括如下步骤:(a)所述管理节点根据风扇的型号绘制每个风扇的风压风量的特性曲线;(b)针对每个计算节点,所述管理节点依据该计算节点的物理位置、风扇的物理位置和风扇的特性曲线,计算出每个风扇对该计算节点的散热贡献值;(c)当某个计算节点的负载增大导致其温度升高时,所述管理节点通过所述管理总线就会得到该计算节点的负载和温度变化的信息,之后,所述管理节点依据各风扇对该计算节点的散热贡献值来按比例调节各个风扇的转速,使相关的风扇共同作用形成散热的合力,以实现相关风扇的精准调节,从而加大用于所述计算节点的风量,并且单个风扇的调节量相对地变小;以及(d)当某个计算节点的负载减少时,所述管理节点会依据各风扇对该计算节点的散热贡献值来采取与步骤(c)相反的操作,从而减小用于所述计算节点的风量,并且单个风扇的调节量相对地变小。2.如权利要求1所述的刀片服务器的散热控制方法,还包括如下步骤:当某一个风扇发生故障并得到所述管理节点的确定后,所述管理节点将重复步骤(a)和步骤(b),得到新的每个风扇对计算节点的散热贡献值,并依此进行风扇的调节控制。3.如权利要求1或2所述的刀片服务器的散热控制方法,还包括如下步骤:所述管理节点的网络传输模块将所述管理节点所获得的数据以无线传输的方式传递至操作人员的手机。4.如权利要求1或2所述的刀片服务器的散热控制方法,还包括如下步骤:当出现风扇故障,或者在散热达到散热危险阈值前,所述管理节点的报警器能够以声音和/或光的形式发出警报,以提醒操作人员及时进行处理。5.一种刀片服务器的散热控制系统,包括:多个计算节点,所述计算节点是所述刀片服务器中的监测点;管理节点,所述管理节点是散热控制系统的控制器;以及风扇系统,所述风扇系统包含多个风扇,其中,所述管理节点与所述计算...

【专利技术属性】
技术研发人员:汪志水苏信郎维良
申请(专利权)人:同方工业信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1