【技术实现步骤摘要】
面向算力网络中异构算力资源的时延约束调度方法
[0001]本专利技术涉及无线通信领域,具体涉及一种面向算力网络中异构算力资源的时延约束调度方法。
技术介绍
[0002]算力网络是一种新型的服务概念,它融合了异构资源、分布式算力并完成统一的编排调度,创新了服务模式。算力网络的重点技术包括资源标识、异构资源调度、分布式算力调度等。在算力网络中,异构算力资源包括:CPU、GPU、NPU、FPGA、ASIC等。其中,CPU是最常见的算力资源,而GPU则是最常用的异构算力加速器。面向海量的异构算力,不同的场景需要不同的算力进行协同处理。通过算力网络来协同和纳管调度异构算力,构建起“云、边、端”一体的异构算力协同网络,从而更好的满足包括高性能计算、物联网、边缘计算、人工智能等众多场景的算力需求。
[0003]动态电压频率缩放技术(Dynamic Voltage and Frequency Scaling,DVFS)是一种低功耗技术,目的是根据芯片当时的实际功耗需要设定工作电压和时钟频率,这样可以保证提供的功率既满足要求又不会性能过剩,从而可以降低功耗。DVFS技术利用了CMOS芯片的特性,即在不改变芯片结构的情况下,根据芯片所运行的应用程序对计算能力的不同需要,动态调节芯片的运行频率和电压,从而达到节能的目的。基于DVFS技术对异构算力服务器进行性能建模可以更好的实现能耗优化。
[0004]异构算力资源的调度优化存在以下两个挑战。一是不同类型算力服务器的性能建模和同一编排调度,计算任务本身的特性决定了其在不同类型 ...
【技术保护点】
【技术特征摘要】
1.一种面向算力网络中异构算力资源的时延约束调度方法,其特征在于,包括如下步骤:1)获取如下信息:算力网络中多核CPU服务器{S1,S2,,S
M
}的数量M,核心频率的缩放范围;CPU
‑
GPU异构服务器{S
M+1
,S
M+2
,,S
M+K
}的数量K、核心电压频率和内存频率的缩放范围;待调度任务{Γ1,Γ2,,Γ
N
}的数量N、数据量J
i
、计算量L
i
、加速因子θ
i
和时延约束D;算力网络中任务Γ
i
与服务器S
j
之间的传输带宽R
i,j
和传输功率2)初始化服务器的性能参数配置:初始化多核CPU服务器的核心频率和异构服务器内存频率如下:其中,[
·
]
max
和[
·
]
min
分别表示相应参数动态缩放范围的上下限;初始化异构服务器核心频率如下,把异构服务器核心电压设置为得到其中,ε1,ε2是通过测量结果拟合得到的服务器硬件相关系数;3)利用投影梯度法初始化调度策略矩阵α={α
i,j
}
N*(M+K)
,其中α
i,j
的值表示任务Γ
i
被调度到服务器S
j
上进行计算的比例,满足0≤α
i,j
≤1,初始调度策略矩阵记作α0;4)在第k次迭代中,固定调度策略α
k
,依据动态电压频率缩放技术优化服务器的计算能耗,更新服务器性能参数:5)计算第k次迭代时总能耗E
k
关于调度策略α
k
的梯度记为s
k
;固定服务器性能参数,更新调度策略α
k+1
=Update(α
k
,s
k
);6)重复步骤4)和5)直到满足收敛条件||α
k+1
‑
α
k
||2≤ε,得到能耗最优的分配策略和服务器性能参数,其中ε为交替优化调度策略α
k
时的收敛阈值。2.根据权利要求1所述的方法,其特征在于,步骤3)所述的利用投影梯度法对调度策略进行初始化,步骤如下:3.1)固定服务器性能参数,计算得到总能耗关于调度策略的梯度3.1)固定服务器性能参数,计算得到总能耗关于调度策略的梯度利用投影梯度法更新调度策略α0(l+1)=Update(α0(l),s0);
其中,l表示初始化调度策略α0的迭代次数,γ
j
,P0是取决于硬件特性的常系数;表示多核CPU服务器功率对频率缩放的敏感度;γ
j
,η
jG
分别表示CPU
‑
GPU异构服务器功率对内存频率缩放和核心电压/频率缩放的灵敏度;P0表示异构服务器中用于控制GPU进行运算的CPU的功耗;θ
i
是与应用特性有关的加速因子;3.2)重复步骤3.1)直到满足收敛条件||α0(l+1)
...
【专利技术属性】
技术研发人员:张文凯,叶朝阳,张士聪,顾晨辉,王玮,张朝阳,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。