【技术实现步骤摘要】
云计算系统的资源调度方法、应用识别方法以及相关设备
[0001]本申请实施例涉及计算机领域,尤其涉及云计算系统的资源调度方法、应用识别方法以及相关设备。
技术介绍
[0002]随着互联网的不断发展,作为信息基础设施的数据中心的规模也日益增长。然而,当前大多数数据中心中的资源利用率依旧很低。为了降低成本,可以同时运行多个应用共享底层的资源来提升资源利用率。虽然应用的共置能有效地提高资源利用率,但是部署在同一台物理机上的应用会争夺共享资源,导致应用间的干扰频繁发生。
[0003]在一种资源调度方法中,每个延迟敏感型(latency critical,LC)型应用有固定的隔离区资源,基于强化学习的方式,对于不可隔离的共享资源进行处理,从而确定满足LC型应用的服务目标质量的资源分配方案。
[0004]在这种方法中,由于每个LC型应用有固定的隔离区资源,在应用所需资源较少的情况下,应用占有的固定隔离区资源可能会远大于实际需求,从而导致资源利用率低。
技术实现思路
[0005]本申请实施例提供了云计算系统的资源调度方法、应用识别方法以及相关设备,在资源调度方法中,根据计算机系统中各个LC型应用的剩余干扰容忍度的不同取值,确定不同的资源调度方式,从而实现增加LC型应用的隔离区资源,或者减少LC型应用的隔离区资源以增加计算机系统的共享区资源,实现了隔离区资源与共享区资源的灵活分配,提升了资源的利用率。同时,通过调度隔离区资源和共享区资源,降低了应用之间的干扰,也提升了系统性能。
[0006]本 ...
【技术保护点】
【技术特征摘要】
1.一种云计算系统的资源调度方法,其特征在于,所述方法应用于资源调度器,所述方法包括:获取计算机系统中包括的多个延迟敏感LC型应用中每个LC型应用的剩余干扰容忍度;从所述多个LC型应用中,获取剩余干扰容忍度最小的第一LC型应用;若所述第一LC型应用的剩余干扰容忍度小于容忍度下限,则增加所述第一LC型应用的第一隔离区资源;若所述第一LC型应用的剩余干扰容忍度大于容忍度上限,则将所述多个LC型应用中的第二LC型应用的第二隔离区资源转移至资源共享区。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取计算机系统的当前系统熵,所述当前系统熵用于当前指示所述计算机系统中应用之间的干扰程度;所述若所述第一LC型应用的剩余干扰容忍度小于容忍度下限,则增加所述第一LC型应用的第一隔离区资源,包括:若所述当前系统熵大于或等于系统熵阈值,且所述第一LC型应用的剩余干扰容忍度小于所述容忍度下限,则增加所述第一隔离区资源;所述若所述第一LC型应用的剩余干扰容忍度大于容忍度上限,则将所述多个LC型应用中的第二LC型应用的第二隔离区资源转移至资源共享区,包括:若所述当前系统熵大于或等于所述系统熵阈值,且所述第一LC型应用的剩余干扰容忍度大于所述容忍度上限,则将所述第二LC型应用的第二隔离区资源转移至资源共享区。3.根据权利要求1或2所述的方法,其特征在于,所述增加所述第一LC型应用的隔离区资源,包括:若所述计算机系统中存在剩余干扰容忍度大于所述容忍度上限,且具有可剥离的第三隔离区资源的第三LC型应用,则将所述第三隔离区资源中的资源转移至所述第一LC型应用对应的第一隔离区,以增加所述第一隔离区资源;若所述计算机系统中不存在所述第三LC型应用,则将所述资源共享区的资源转移至所述第一隔离区,以增加所述第一隔离区资源。4.根据权利要求2或3所述的方法,其特征在于,所述获取计算机系统的当前系统熵,包括:获取所述每个LC型应用能容忍的干扰量和所述每个LC型应用实际受到的干扰量;根据所述每个LC型应用能容忍的干扰量和所述每个LC型应用实际受到的干扰量,确定所述当前系统熵。5.根据权利要求2或3所述的方法,其特征在于,所述计算机系统还包括至少一个尽力而为BE型应用;在所述获取计算机系统的当前系统熵之前,所述方法还包括:获取来自于应用区分器或来自于用户的第一应用标识和第二应用标识,所述第一应用标识用于指示LC型应用,所述第二应用标识用于指示BE型应用;根据所述第一应用标识,确定所述计算机系统中的LC型应用;根据所述第二应用标识,确定所述计算机系统中的BE型应用;所述获取计算机系统的当前系统熵,包括:获取所述每个LC型应用能容忍的干扰量和所述每个LC型应用实际受到的干扰量;
根据所述每个LC型应用能容忍的干扰量和所述每个LC型应用实际受到的干扰量,确定所述多个LC型应用的熵;获取所述至少一个BE型应用中每个BE型应用单独运行时的第一每周期指令数和所述每个BE型应用受干扰后的第二每周期指令数;根据所述第一每周期指令数和所述第二每周期指令数,确定所述至少一个BE型应用的熵;根据所述多个LC型应用的熵和所述至少一个BE型应用的熵,确定所述当前系统熵。6.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:获取来自于服务质量预测器的第一调度信息或第二调度信息,所述第一调度信息指示增加所述多个LC型应用中目标LC型应用的隔离区资源,所述第二调度信息指示减少所述目标LC型应用的隔离区资源;根据所述第一调度信息,增加所述目标LC型应用的隔离区资源;或者,根据所述第二调度信息,减少所述目标LC型应用的隔离区资源。7.根据权利要求2至6中任一项所述的方法,其特征在于,所述方法还包括:获取所述计算机系统资源调度后的系统熵;若所述资源调度后的系统熵小于所述当前系统熵,则确定资源调度成功。8.一种云计算系统的资源调度方法,其特征在于,所述方法应用于服务质量预测器,所述方法包括:获取目标LC型应用对应的多个网络接收队列长度;计算所述多个网络接收队列长度的均值,得到平均网络接收队列长度;若所述平均网络接收队列长度大于长度阈值,则向资源调度器发送第一调度信息,所述第一调度信息指示增加所述目标LC型应用的隔离区资源;若所述平均网络接收队列长度小于或等于所述长度阈值,且所述多个网络接收队列长度中取值为0的网络接收队列长度在所述多个网络接收队列长度中的占比大于比例阈值,则向所述资源调度器发送第二调度信息,所述第二调度信息指示减少所述目标LC型应用的隔离区资源。9.一种应用识别方法,其特征在于,所述方法应用于应用区分器,所述方法包括:获取计算机系统中多个应用在当前阶段的多个网络总带宽平均值;根据所述多个网络总带宽平均值,确定所述多个应用在所述当前阶段的多个网络总带宽区间变异系数;若所述多个网络总带宽区间变异系数大于区间系数阈值,则获取所述多个应用在所述当前阶段的多个末尾发送/接收带宽比例与下一阶段的多个起始发送/接收带宽比例的多个差值绝对值;获取所述多个应用在所述当前阶段的前后目标时间段内的多个发送/接收带宽比例变异系数;根据所述多个差值绝对值或所述多个发送/接收带宽比例变异系数,确定所述多个应用中LC型应用的标识为第一应用标识,所述多个应用中BE型应用的标识为第二应用标识;向资源调度器发送所述第一应用标识和所述第二应用标识,以使所述资源调度器区分所述BE型应用和所述LC型应用。
10.根据权利要求9所述的方法,其特征在于,根据所述多个差值绝对值或所述多个发送/接收带宽比例变异系数,确定所述多个应用中LC型应用的标识为第一应用标识,所述多个应用中BE型应用的标识为第二应用标识,包括:从所述多个应用中,确定差值绝对值大于差值阈值,和/或,发送/接收带宽比例变异系数大于系数阈值的应用,为BE型应用;标记所述BE型应用的标识为所述第二应用标识;标记所述多个应用中所述BE型应用之外的应用的标识为第一应用标识。11.一种资源调度系统,其特征在于,所述资源调度系统包括资源调度器,所述资源调度器用于:获取计算机系统中包括的至少一个延迟敏感LC型应用中每个LC型应用的剩余干扰容忍度;从所述多个LC型应用中,获取剩余干扰容忍度最小的第一LC型应用;若所述第一LC型应用的剩余干扰容忍度小于容忍度下限,则增加所述第一LC型应用的第一隔离区资源;若所述第一LC型应用的剩余干扰容忍度大于容忍度上限,则将所述多个LC型应用中的第二LC型应用的第二隔离区资源转移至资源共享区。12.根据权利要求11所述的资源调度系统,其特征在于,所述资源调度器还用于:获取来自于应用区分器的第一应用标识和第二应用标识,所述第一应用标识用于指示LC型应用,所述第二应用标识用于指示BE型应用;根据所述第一应用标识,确定所述计算机系统中的LC型应用;根据所述第二应用标识,确定所述计算机系统中的BE型应用。13.根据权利要求12所述的资源调度系统,其特征在于,所述资源调度系统还包括所述应用区分器,所述应用区分器用于:获取计算机系统中多个应用在当前阶段的多个网络总带宽平均值;根据所述多个网络总带宽平均值,确定所述多个应用在所述当前阶段的多个网络总带宽区间变异系数;若所述多个网络总带宽区间变异系数大于区间系数阈值,则获取所述多个应用在所述当前阶段的多个末尾发送/接收带宽比例与下一阶段的多个起始发送/接收带宽比例的多个差值绝对值;获取所述多个应用在所述当前阶段的前后目标时间段内的多个发送/接收带宽比例变异系数;根据所述多个差值绝对值或所述多个发送/接收带宽比例变异系数,确定所述多个应用中LC型应用的标识为第一应用标识,所述多个应用中BE型应用的标识为第二应用标识;向所述资源调度器发送所述第一应用...
【专利技术属性】
技术研发人员:刘宇航,邓鑫,陈明宇,包云岗,俞洲,
申请(专利权)人:华为云计算技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。