用于服务器集群的负载均衡方法、装置、设备及介质制造方法及图纸

技术编号:35782525 阅读:11 留言:0更新日期:2022-12-01 14:28
本发明专利技术涉及集群服务器技术领域,尤其涉及一种用于服务器集群的负载均衡方法、装置、设备及介质。所述方法包括:利用每个服务器的基板管理控制器获取服务器的运行参数;根据所述运行参数计算每个服务器负载分数;将集群中各个服务器的负载分数发送给负载均衡器;由所述负载均衡器根据各个服务器的负载分数从集群的所有服务器中选取目标服务器,并将集群的待处理任务分配给所述目标服务器。本发明专利技术的方案实现更为全面、更为准确的评估出服务器整体负载情况,有效提高了服务器集群的负载均衡能力,提升了服务器集群的整体性能,同时无需增加额外的硬件设施和成本。加额外的硬件设施和成本。加额外的硬件设施和成本。

【技术实现步骤摘要】
用于服务器集群的负载均衡方法、装置、设备及介质


[0001]本专利技术涉及集群服务器
,尤其涉及一种用于服务器集群的负载均衡方法、装置、设备及介质。

技术介绍

[0002]随着业务发展和数据的不断积累,高性能的单台服务器无法处理大量的数据和高并发用户的集中访问。为提升服务器整体计算能力,服务器集群应运而生。为避免单独一个服务器压力过大,通常采用负载均衡策略将来自用户的请求转发给不同的服务器。目前普遍采用的负载均衡策略主要包括轮询策略、权重轮询策略和负载度策略。其中轮询和权重轮询策略均基于被动均摊原则,缺乏灵活性,并且难以适用于计算性能不同的处理器组成的集群。负载度策略则需要负载均衡器通过采集连接数、请求数、CPU负载指标、IO负载指标等数据动态评估后端各服务器的负载压力,进而将请求下发给负载压力较小的服务器。
[0003]然而,随着人工智能和大数据的快速发展,服务器内部GPU、FPGA等计算设备的种类和数量日益增多,一方面目前负载度策略仍只侧重于计算CPU和IO的负载压力,无法全面评估服务器整体的计算负载,也未将温度、风扇转速等服务器物理状态对负载的影响计算在内,导致对集群中服务器负载分配效果不佳;另一方面目前为了实现集群中服务器的各个服务器负载均衡而添加额外的监控设备造成集群管理的成本变高,因此亟需改进。

技术实现思路

[0004]有鉴于此,有必要针对以上技术问题,提供一种用于服务器集群的负载均衡方法、装置、设备及介质。
[0005]根据本专利技术的第一方面,提供了一种用于服务器集群的负载均衡方法,所述方法包括:
[0006]利用每个服务器的基板管理控制器获取服务器的运行参数;
[0007]根据所述运行参数计算每个服务器负载分数;
[0008]将集群中各个服务器的负载分数发送给负载均衡器;
[0009]由所述负载均衡器根据各个服务器的负载分数从集群的所有服务器中选取目标服务器,并将集群的待处理任务分配给所述目标服务器。
[0010]在一些实施例中,所述利用每个服务器的基板管理控制器获取服务器的运行参数包括:
[0011]从集群中的每个服务器基板管理控制器分别读取机箱温度。
[0012]在一些实施例中,所述根据所述运行参数计算每个服务器负载分数包括:
[0013]将读取的每个机箱温度分别与预设机箱温度阈值进行比较;
[0014]响应于读取的机箱温度超过所述预设机箱温度阈值,则确认读取的机箱温度对应的服务器的负载分数为1。
[0015]在一些实施例中,所述利用每个服务器的基板管理控制器获取服务器的运行参数
包括:
[0016]从集群中的每个服务器基板管理控制器分别读取风扇转速。
[0017]在一些实施例中,所述根据所述运行参数计算每个服务器负载分数包括:
[0018]将读取的每个风扇转速分别与预设风扇转速阈值进行比较;
[0019]响应于读取的风扇转速超过所述预设风扇转速阈值,则确认读取的风扇转速对应的服务器的负载分数为1。
[0020]在一些实施例中,所述利用每个服务器的基板管理控制器获取服务器的运行参数还包括:
[0021]从集群中的每个服务器基板管理控制器分别读取中央处理器温度。
[0022]在一些实施例中,所述根据所述运行参数计算每个服务器负载分数还包括:
[0023]响应于读取的机箱温度未超过所述预设机箱温度阈值、或者响应于读取的风扇转速未超过所述预设风扇转速阈值,则将读取的中央处理器温度与预设中央处理器温度阈值进行比较;
[0024]响应于读取的中央处理器温度超过预设中央处理器温度阈值,则确认读取的中央处理器温度对应的服务器的负载分数为1。
[0025]在一些实施例中,所述利用每个服务器的基板管理控制器获取服务器的运行参数还包括:
[0026]从集群中的每个服务器基板管理控制器分别读取中央处理器负载值、内存负载值、IO负载值、GPU负载值、FPGA负载值、XPU负载值。
[0027]在一些实施例中,所述根据所述运行参数计算每个服务器负载分数还包括:
[0028]响应于读取的中央处理器温度未超过预设中央处理器温度阈值,则将读取的机箱温度、中央处理器温度、中央处理器负载值、内存负载值、IO负载值、GPU负载值、FPGA负载值、XPU负载值代入下述公式计算得负载分数;
[0029][0030]其中,L
t
为该服务器得到的负载分数,T
S
、T
SM
分别为机箱温度及预设机箱温度阈值,T
C
、T
CM
分别为中央处理器温度及预设中央处理器温度阈值,L
C
、L
CM
分别为中央处理器负载值及预设中央处理器负载阈值,L
M
、L
MM
分别为内存负载值及预设内存负载阈值,L
IO
、L
IOM
分别为IO负载值及预设IO负载阈值,L
G
、L
GM
分别为GPU负载值及预设GPU负载阈值,L
F
、L
FM
分别为FPGA负载值及预设FPGA负载阈值,L
n
、L
nM
分别为XPU负载值及预设XPU负载阈值,w1,w2,

w
n
为各个项对应的权重,且有w1+w2+

+w
n
=1。
[0031]在一些实施例中,所述由所述负载均衡器根据各个服务器的负载分数从集群的所有服务器中选取目标服务器包括:
[0032]对集群中所有服务器的负载分数按照数值大小进行排序;
[0033]基于所述排序将集群中所有服务器的负载分数最低的作为目标服务器。
[0034]在一些实施例中,所述方法还包括:
[0035]响应于某个服务器的中央处理器、GPU、FPGA、XPU为多个,则用于计算的中央处理器温度为多个中央处理器温度值中最高的、用于计算的中央处理器负载值为多个中央处理器负载值中最大的、用于计算的GPU负载值为多个GPU负载值中最大的、用于计算的FPGA负
载值为多个FPGA负载值中最大的、用于计算的XPU负载值为多个XPU负载值中最大的。
[0036]在一些实施例中,XPU为智能网卡。
[0037]根据本专利技术的第二方面,提供了一种用于服务器集群的负载均衡装置,所述装置包括:
[0038]获取模块,配置用于利用每个服务器的基板管理控制器获取服务器的运行参数;
[0039]计算模块,配置用于根据所述运行参数计算每个服务器负载分数;
[0040]发送模块,配置用于将集群各个服务器的负载分数发送给负载均衡器;
[0041]任务分配模块,配置用于由所述负载均衡器根据各个服务器的负载分数从集群的所有服务器中选取目标服本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于服务器集群的负载均衡方法,其特征在于,所述方法包括:利用每个服务器的基板管理控制器获取服务器的运行参数;根据所述运行参数计算每个服务器负载分数;将集群中各个服务器的负载分数发送给负载均衡器;由所述负载均衡器根据各个服务器的负载分数从集群的所有服务器中选取目标服务器,并将集群的待处理任务分配给所述目标服务器。2.根据权利要求1所述的用于服务器集群的负载均衡方法,其特征在于,所述利用每个服务器的基板管理控制器获取服务器的运行参数包括:从集群中的每个服务器基板管理控制器分别读取机箱温度。3.根据权利要求2所述的用于服务器集群的负载均衡方法,其特征在于,所述根据所述运行参数计算每个服务器负载分数包括:将读取的每个机箱温度分别与预设机箱温度阈值进行比较;响应于读取的机箱温度超过所述预设机箱温度阈值,则确认读取的机箱温度对应的服务器的负载分数为1。4.根据权利要求1所述的用于服务器集群的负载均衡方法,其特征在于,所述利用每个服务器的基板管理控制器获取服务器的运行参数包括:从集群中的每个服务器基板管理控制器分别读取风扇转速。5.根据权利要求4所述的用于服务器集群的负载均衡方法,其特征在于,所述根据所述运行参数计算每个服务器负载分数包括:将读取的每个风扇转速分别与预设风扇转速阈值进行比较;响应于读取的风扇转速超过所述预设风扇转速阈值,则确认读取的风扇转速对应的服务器的负载分数为1。6.根据权利要求3或5所述的用于服务器集群的负载均衡方法,其特征在于,所述利用每个服务器的基板管理控制器获取服务器的运行参数还包括:从集群中的每个服务器基板管理控制器分别读取中央处理器温度。7.根据权利要求6所述的用于服务器集群的负载均衡方法,其特征在于,所述根据所述运行参数计算每个服务器负载分数还包括:响应于读取的机箱温度未超过所述预设机箱温度阈值、或者响应于读取的风扇转速未超过所述预设风扇转速阈值,则将读取的中央处理器温度与预设中央处理器温度阈值进行比较;响应于读取的中央处理器温度超过预设中央处理器温度阈值,则确认读取的中央处理器温度对应的服务器的负载分数为1。8.根据权利要求7所述的用于服务器集群的负载均衡方法,其特征在于,所述利用每个服务器的基板管理控制器获取服务器的运行参数还包括:从集群中的每个服务器基板管理控制器分别读取中央处理器负载值、内存负载值、IO负载值、GPU负载值、FPGA负载值、XPU负载值。9.根据权利要求8所述的用于服务器集群的负载均衡方法,其特征在于,所述根据所述运行参数计算每个服务器负载分数还包括:响应于读取的中央处理器温度未超过预设中央处理器温度阈值,则将读取的机箱温
度、中央处理器温度、中央处理器负载值、内存负载值、IO负载值、GPU负载值、FPGA负载值、XPU负载值代入下述公式计算得负载分数;其中,L
t
为该服务器得到的负载分数,T
S
、T
SM
分别为机箱温度及预设机箱温度阈...

【专利技术属性】
技术研发人员:苏康郭芬李中华李拓
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1