基于智能算法的服务器集群控制平台制造技术

技术编号:37812710 阅读:17 留言:0更新日期:2023-06-09 09:42
本发明专利技术涉及一种基于智能算法的服务器集群控制平台,包括:热量分析机构,用于基于服务器集群的多项运行数据以及服务器集群在下一时间区间之前各个时间区间分别对应的各个整体散热量解析服务器集群在下一时间区间的整体散热量的预测数值;动态处理机构,用于在预测数值超过预设热量阈值时,启动服务器集群的备用制冷机构。本发明专利技术的基于智能算法的服务器集群控制平台运行稳定、操控智能。由于能够采用智能算法以基于服务器集群的多项运行数据以及服务器集群的多项历史散热数据预测服务器集群后续时间区间的整体散热量,并基于预测的整体散热量定制相应的补充制冷散热策略,从而提升了服务器集群整体散热控制的智能化水准。准。准。

【技术实现步骤摘要】
基于智能算法的服务器集群控制平台


[0001]本专利技术涉及人工智能领域,尤其涉及一种基于智能算法的服务器集群控制平台。

技术介绍

[0002]计算机集群简称集群,是一种计算机系统,它通过一组松散集成的计算机软件或硬件连接起来高度紧密地协作完成计算工作。在某种意义上,他们可以被看作是一台计算机。
[0003]集群系统中的单个计算机通常称为节点,通常通过局域网连接,但也有其它的可能连接方式。集群计算机通常用来改进单个计算机的计算速度和/或可靠性。一般情况下集群计算机比单个计算机,比如工作站或超级计算机性能价格比要高得多。
[0004]高性能计算集群采用将计算任务分配到集群的不同计算节点儿提高计算能力,因而主要应用在科学计算领域。比较流行的HPC采用Linux操作系统和其它一些免费软件来完成并行运算。这一集群配置通常被称为Beowulf集群。这类集群通常运行特定的程序以发挥HPC cluster的并行能力。这类程序一般应用特定的运行库, 比如专为科学计算设计的MPI库。
[0005]目前,高性能服务器集群可以由高性能计算集群来实现,一个高性能服务器集群由多个服务器构成,作为单个服务器,其发射的热量以及散热策略很容易估算和制定,但是针对由多个服务器构成的高性能服务器集群,因为其结构的复杂性,导致未来时间区间的整体发射的热量难以估算,进而难以制定对高性能服务器集群的未来时刻的有效的散热策略,容易影响高性能服务器集群的工作性能和系统健壮性。
[0006]苏州浪潮智能科技有限公司在该领域内已经公开了一些技术方案,例如:1. 申请公布号CN115437486A的专利技术实施例提供了一种基于模型的服务器散热方法、装置、服务器和存储介质,方法包括:获取服务器中多个处理器的温度信息;若获取的处理器的温度信息位于预设温度范围,则获取基于当前数据集进行训练的训练时长和训练时长范围,若训练时长不位于训练时长范围,则根据处理器的温度信息进行PID温度控制,以控制处理器的温度,直至获取另一组数据集的训练时长满足训练时长范围,在该专利技术实施例中,通过部署的机器学习模型的数据集的训练时长,进行调控处理器的温度,直至获取另一组数据集的训练时长满足数据集对应训练时长范围,解决了高性能运算的服务器的散热问题,实现让实时服务器中处理器的运算性能处于最佳状态。
[0007]2. 申请公布号CN115469730A的专利技术实施例提供了一种服务器散热的控制方法、装置、计算机设备和存储介质。所述方法包括:采集当前环境参数以及服务器内至少一个子区域的至少一个当前局部温度,其中,所述当前环境参数至少包括以下之一:当前环境温度和当前环境湿度;对各个所述当前局部温度进行融合,得到所述服务器内部的第一全局温度,基于所述当前环境参数以及所述第一全局温度,获得第一转速;控制风扇以所述第一转速运行,以使所述服务器散热。采用该方法能够改善现有技术中对服务器散热调控的效率和精准度较低的现象。
[0008]3. 申请公布号CN115145379A的专利技术实施例提供了一种具有智能管理服务器散热的节能控制系统,包括:服务器监控子系统;服务器监控子系统包括:供电组件和反馈调节组件;供电组件设有供电板和信号控制板,供电板通过供电线缆连接有风扇背板,风扇背板与风扇组连接,给风扇组供电;风扇组的控制端通过信号控制板与服务器的BMC模块连接;反馈调节组件设有IIC链路模块;BMC模块通过IIC链路模块获取风扇组的TACH信号,BMC模块根据预设的散热策略通过PWM调速控制风扇转速。该专利技术实现对服务器内监控小系统的散热策略,当服务器关机后,对小系统散热作用较小的风扇将停止工作,降低功耗。

技术实现思路

[0009]本专利技术提供了一种基于智能算法的服务器集群控制平台,可以解决上述问题。
[0010]本专利技术是这样实现的,所述平台包括:内容获取器件,与服务器集群连接,用于获取所述服务器集群的多项运行数据,所述服务器集群由多个结构相同且均匀间隔设置的服务器构成,用于协同执行一个以上并发任务,所述服务器集群的多项运行数据包括并发任务数量、任务平均运算量、服务器数量、单服务器最大运算速度、制冷结构输出功率以及相邻两个服务器相隔距离;数据检测器件,与服务器集群连接,用于获取所述服务器集群在下一时间区间之前各个时间区间分别对应的各个整体散热量,所述下一时间区间之前各个时间区间包括当前时间区间,所述下一时间区间与其之前各个时间区间组成一个完整的时间段且每一个时间区间的长度相等;网络重构器件,用于对BP神经网络执行基于多次学习操作的重构处理以获得重构后的BP神经网络;热量分析机构,分别与所述内容获取器件、所述数据检测器件以及所述网络重构器件连接,用于将所述服务器集群的多项运行数据以及所述服务器集群在下一时间区间之前各个时间区间分别对应的各个整体散热量并行输入到所述重构后的BP神经网络,并执行所述重构后的BP神经网络以获得所述重构后的BP神经网络输出的所述服务器集群在下一时间区间的整体散热量的预测数值;动态处理机构,与所述热量分析机构连接,用于在接收到的预测数值超过预设热量阈值时,启动所述服务器集群的备用制冷机构;其中,在接收到的预测数值超过预设热量阈值时,启动所述服务器集群的备用制冷机构包括:启动的备用制冷机构的数量与所述预测数值和所述预设热量阈值的差值正向关联;其中,所述下一时间区间与其之前各个时间区间组成一个完整的时间段且每一个时间区间的长度相等包括:所述服务器数量越多,选择的各个时间区间的数量越多,以及在所述完整的时间段内所述一个以上并发任务未发生并发任务的增减变化。
[0011]本专利技术的基于智能算法的服务器集群控制平台运行稳定、操控智能。由于能够采用智能算法以基于服务器集群的多项运行数据以及服务器集群的多项历史散热数据预测服务器集群后续时间区间的整体散热量,并基于预测的整体散热量定制相应的补充制冷散热策略,从而提升了服务器集群整体散热控制的智能化水准。
附图说明
[0012]以下将结合附图对本专利技术的实施例进行描述。
[0013]图1为根据本专利技术实施例A示出的基于智能算法的服务器集群控制平台的内部结构示意图。
[0014]图2为根据本专利技术实施例B示出的基于智能算法的服务器集群控制平台的内部结构示意图。
[0015]图3为根据本专利技术实施例C示出的基于智能算法的服务器集群控制平台的内部结构示意图。
具体实施方式
[0016]下面将参照附图对本专利技术的基于智能算法的服务器集群控制平台的实施例进行详细说明。
[0017]实施例A
[0018]图1为根据本专利技术实施例A示出的基于智能算法的服务器集群控制平台的内部结构示意图,所述平台包括:内容获取器件,与服务器集群连接,用于获取所述服务器集群的多项运行数据,所述服务器集群由多个结构相同且均匀间隔设置的服务器构成,用于协同执行一个以上并发任务,所述服务器集群的多项运行数据包括并发任务数量、任务平均运算量、服务器数量、单服务器最大运算速度、制冷结构输出功率以及相邻两个服务器相隔距离;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于智能算法的服务器集群控制平台,其特征在于,所述平台包括:内容获取器件,与服务器集群连接,用于获取所述服务器集群的多项运行数据,所述服务器集群由多个结构相同且均匀间隔设置的服务器构成,用于协同执行一个以上并发任务,所述服务器集群的多项运行数据包括并发任务数量、任务平均运算量、服务器数量、单服务器最大运算速度、制冷结构输出功率以及相邻两个服务器相隔距离;其中,所述任务平均运算量为所述多个结构相同的服务器协同完成的一个以上并发任务分别对应的一个以上任务运算量的平均值,所述单服务器最大运算速度为所述多个结构相同的服务器中任一服务器的最大运算速度,所述制冷结构输出功率为所述多个结构相同的服务器中任一服务器的制冷结构执行对相应服务器散热处理时的输出功率;数据检测器件,与服务器集群连接,用于获取所述服务器集群在下一时间区间之前各个时间区间分别对应的各个整体散热量,所述下一时间区间之前各个时间区间包括当前时间区间,所述下一时间区间与其之前各个时间区间组成一个完整的时间段且每一个时间区间的长度相等;网络重构器件,用于对BP神经网络执行基于多次学习操作的重构处理以获得重构后的BP神经网络;热量分析机构,分别与所述内容获取器件、所述数据检测器件以及所述网络重构器件连接,用于将所述服务器集群的多项运行数据以及所述服务器集群在下一时间区间之前各个时间区间分别对应的各个整体散热量并行输入到所述重构后的BP神经网络,并执行所述重构后的BP神经网络以获得所述重构后的BP神经网络输出的所述服务器集群在下一时间区间的整体散热量的预测数值;动态处理机构,与所述热量分析机构连接,用于在接收到的预测数值超过预设热量阈值时,启动所述服务器集群的备用制冷机构;其中,在接收到的预测数值超过预设热量阈值时,启动所述服务器集群的备用制冷机构包括:启动的备用制冷机构的数量与所述预测数值和所述预设热量阈值的差值正向关联;其中,所述下一时间区间与其之前各个时间区间组成一个完整的时间段且每一个时间区间的长度相等包括:所述服务器数量越多,选择的各个时间区间的数量越多,以及在所述完整的时间段内所述一个以上并发任务未发生并发任务的增减变化。2.如权利要求1所...

【专利技术属性】
技术研发人员:史洲铭王一蔚翟天骏顾正铮张岚
申请(专利权)人:江苏智能低碳科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1