【技术实现步骤摘要】
一种资源调度方法及装置
[0001]本申请属于计算机
,具体涉及一种资源调度方法及装置
。
技术介绍
[0002]云计算是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需提供给计算机和其他设备
。
云计算的核心思想是将大量用网络连接的计算资源统一管理和调度,构成一个统一资源池向用户提供按需服务
。
[0003]目前,云计算资源调度策略只能人为设置,无法实现合理的资源调度,且效率低下,限制了云计算的自动化管理策略的进一步发展
。
[0004]申请内容
[0005]本申请实施例的目的是提供一种资源调度方法及装置,以解决现有技术中的云计算资源调度策略效率低下的缺陷
。
[0006]为了解决上述技术问题,本申请是这样实现的:
[0007]第一方面,提供了一种资源调度方法,包括以下步骤:
[0008]根据集群中的多个计算节点的硬件信息,分别获取各个计算节点的综合性能情况,并根据所述综合性能情况,对所述多个计算节点进行汇总分类,标记每个计算节点的类别,得到第一排序结果;
[0009]根据所述第一排序结果和在虚拟机中运行的目标任务集的资源消耗情况,预测目标虚拟机中可能更需要的计算资源,筛选出与所述目标任务集匹配的计算节点集合;
[0010]根据所述虚拟机中最活跃的父子任务流的执行顺序优先级,获取样本任务集,并将所述样本任务集随机下发至所述计算节点集合中的部分计算节点,计算所述部分计算节点模拟运 ...
【技术保护点】
【技术特征摘要】
1.
一种资源调度方法,其特征在于,包括以下步骤:根据集群中的多个计算节点的硬件信息,分别获取各个计算节点的综合性能情况,并根据所述综合性能情况,对所述多个计算节点进行汇总分类,标记每个计算节点的类别,得到第一排序结果;根据所述第一排序结果和在虚拟机中运行的目标任务集的资源消耗情况,预测目标虚拟机中可能更需要的计算资源,筛选出与所述目标任务集匹配的计算节点集合;根据所述虚拟机中最活跃的父子任务流的执行顺序优先级,获取样本任务集,并将所述样本任务集随机下发至所述计算节点集合中的部分计算节点,计算所述部分计算节点模拟运行所述样本任务集所花费的模拟响应时间;根据测得计算节点的模拟响应时间,对所述多个计算节点进行排序,得到第二排序结果,并将所述第二排序结果与所述第一排序结果比对,若所述第二排序结果与所述第一排序结果之间的相似度高于预设阈值,则证明第一排序结果可信,将实际排序结果更新至所述第一排序结果,得到第三排序结果,并根据所述第三排序结果调度计算资源
。2.
根据权利要求1所述的方法,其特征在于,所述硬件信息包括
CPU
芯片数量
、
单颗
CPU
核心数量
、CPU
基准频率
、GPU
芯片数量
、
单颗
GPU CUDA
核心数量
、GPU
核心架构和
GPU
核心频率;所述根据集群中的多个计算节点的硬件信息,分别获取各个计算节点的综合性能情况,具体包括:根据集群中的各个计算节点的硬件信息,通过以下公式分别计算各个计算节点的综合性能分数:
FP
C
=
S
C
×
CO
C
×
F
C
×
V
C
FP
G
=
S
G
×
CU
G
×
F
G
×
α
其中,
N
P
为综合性能分数,
a
为
CPU
性能标准值,
b
为
GPU
性能标准值,
FP
C
为
CPU
双精度浮点计算理论算力,
FP
G
为
GPU
单精度浮点计算理论性能;
S
C
为
CPU
芯片数量,
CO
C
为单颗
CPU
核心数量,
F
C
为
CPU
基准频率,
V
C
为
CPU
单核单周期单精度浮点计算系数;
S
G
为
GPU
芯片数量,
CU
G
为单颗
GPU CUDA
核心数量,
F
G
为
GPU
核心频率,
α
为核心架构权重;所述根据所述综合性能情况,对所述多个计算节点进行汇总分类,标记每个计算节点的类别,得到第一排序结果,具体包括:根据各个计算节点的综合性能分数
N
P
,对所述集群中的多个计算节点进行排序分类,并确定各个计算节点的类别,得到第一排序结果,所述类别包括
CPU
偏向
、GPU
偏向或无偏向
。3.
根据权利要求2所述的方法,其特征在于,所述根据所述第一排序结果和在虚拟机中运行的目标任务集的资源消耗情况,预测目标虚拟机中可能更需要的计算资源,筛选出与所述目标任务集匹配的计算节点集合,具体包括:获取虚拟机中运行的目标任务集的资源消耗情况,并根据所述目标任务集所消耗的
CPU、GPU
和内存资源,评估所述目标任务集偏向的硬件资源的类型;
根据评估结果
、
所述第一排序结果以及所述集群中的各个计算节点的类别,筛选出与所述目标任务集偏向的硬件资源匹配的多个计算节点
。4.
根据权利要求1所述的方法,其特征在于,所述将所述样本任务集随机下发至所述计算节点集合中的部分计算节点,计算所述部分计算节点模拟运行所述样本任务集所花费的模拟响应时间,具体包括:将所述样本任务集下发至所述计算节点集合中的部分计算节点,计算各个计算节点模拟运行所述样本任务集所花费的模拟响应时间;所述根据各个计算节点的模拟响应时间,对所述多个计算节点进行排序,得到第二排序结果,具体包括:根据模拟响应时间的长短顺序,对所述部分计算节点进行排序,得到第二排序结果;所述根据测得计算节点的模拟响应时间,对所述多个计算节点进行排序,得到第二排序结果之后,还包括:在所述第二排序结果与所述第一排序结果之间的相似度低于预设阈值的情况下,将所述样本任务集下发至所述计算节点集合中除所述部分计算节点之外的剩余计算节点,并计算所述剩余计算节点模拟运行所述样本任务集所花费的模拟响应时间;根据所述计算节点集合中的各个计算节点的模拟响应时间的长短顺序,对所述计算节点集合中的所有计算节点进行排序,得到实际最优节点集;按照实际最优节点集中的各个计算节点之间的排序,调度计算资源
。5.
根据权利要求1所述的方法,其特征在于,所述若所述第二排序结果与所述第一排序结果之间的相似度高于预设阈值,则证明第一排序结果可信,将实际排序结果更新至所述第一排序结果,得到第三排序结果,具体包括:在所述第二排序结果与所述第一排序结果之间的相似度高于预设阈值的情况下,则说明所述第一排序结果...
【专利技术属性】
技术研发人员:张肇晖,
申请(专利权)人:赛尔新技术北京有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。