云计算系统的资源调度方法、应用识别方法以及相关设备技术方案

技术编号:39042188 阅读:14 留言:0更新日期:2023-10-10 11:55
本申请实施例公开了云计算系统的资源调度方法、应用识别方法以及相关设备,用于提升资源利用率,降低计算机系统中应用之间的干扰。资源调度方法应用于资源调度器,方法包括:获取计算机系统中包括的至少一个延迟敏感LC型应用中每个LC型应用的剩余干扰容忍度;从多个LC型应用中,获取剩余干扰容忍度最小的第一LC型应用。若第一LC型应用的剩余干扰容忍度小于容忍度下限,则增加第一LC型应用的第一隔离区资源。若第一LC型应用的剩余干扰容忍度大于容忍度上限,则将多个LC型应用中的第二LC型应用的第二隔离区资源转移至资源共享区。用的第二隔离区资源转移至资源共享区。用的第二隔离区资源转移至资源共享区。

【技术实现步骤摘要】
云计算系统的资源调度方法、应用识别方法以及相关设备


[0001]本申请实施例涉及计算机领域,尤其涉及云计算系统的资源调度方法、应用识别方法以及相关设备。

技术介绍

[0002]随着互联网的不断发展,作为信息基础设施的数据中心的规模也日益增长。然而,当前大多数数据中心中的资源利用率依旧很低。为了降低成本,可以同时运行多个应用共享底层的资源来提升资源利用率。虽然应用的共置能有效地提高资源利用率,但是部署在同一台物理机上的应用会争夺共享资源,导致应用间的干扰频繁发生。
[0003]在一种资源调度方法中,每个延迟敏感型(latency critical,LC)型应用有固定的隔离区资源,基于强化学习的方式,对于不可隔离的共享资源进行处理,从而确定满足LC型应用的服务目标质量的资源分配方案。
[0004]在这种方法中,由于每个LC型应用有固定的隔离区资源,在应用所需资源较少的情况下,应用占有的固定隔离区资源可能会远大于实际需求,从而导致资源利用率低。

技术实现思路

[0005]本申请实施例提供了云计算系统的资源调度方法、应用识别方法以及相关设备,在资源调度方法中,根据计算机系统中各个LC型应用的剩余干扰容忍度的不同取值,确定不同的资源调度方式,从而实现增加LC型应用的隔离区资源,或者减少LC型应用的隔离区资源以增加计算机系统的共享区资源,实现了隔离区资源与共享区资源的灵活分配,提升了资源的利用率。同时,通过调度隔离区资源和共享区资源,降低了应用之间的干扰,也提升了系统性能。
[0006]本申请实施例第一方面提供了一种云计算系统的资源调度方法,该方法应用于资源调度器,方法包括:
[0007]计算机系统中运行有多个LC型应用,资源调度器能够自行计算或者接收来自于计算设备的每个LC型应用的剩余干扰容忍度。剩余干扰容忍度能够反映每个LC型应用受干扰的程度,剩余干扰容忍度越小,表示该LC型应用受干扰的程度越大。之后,资源调度器从这多个LC型应用中选择剩余干扰容忍度最小的第一LC型应用。并比较第一LC型应用的剩余干扰容忍度与容忍度下限的关系,以此确定是否需要对第一LC型应用的隔离区资源进行调整。如果第一LC型应用的剩余干扰容忍度小于容忍度下限,意味着第一LC型应用受到了严重的干扰,资源紧张,则增加第一LC型应用的第一隔离区资源。如果若第一LC型应用的剩余干扰容忍度大于容忍度上限,又因为第一LC型应用是所有LC型应用中剩余干扰容忍度最小的,因此可以认为所有的LC型应用都没有受到干扰或者受干扰程度小,可以将多个LC型应用中的第二LC型应用的第二隔离区资源转移至资源共享区。其中,第二LC型应用的剩余干扰容忍度大于第一LC型应用的剩余干扰容忍度。可选的,第二LC型应用的剩余干扰容忍度可以是多个LC型应用中最大的。
[0008]从以上技术方案可以看出,本申请实施例具有以下优点:
[0009]根据计算机系统中各个LC型应用的剩余干扰容忍度的不同取值,确定不同的资源调度方式,从而实现增加LC型应用的隔离区资源,或者减少LC型应用的隔离区资源以增加计算机系统的共享区资源,实现了隔离区资源与共享区资源的灵活分配,提升了资源的利用率。同时,通过调度隔离区资源和共享区资源,降低了应用之间的干扰,也提升了系统性能。
[0010]在第一方面的一些可选实施例中,资源调度器还可以获取计算机系统的当前系统熵,当前系统熵用于当前指示计算机系统中应用之间的干扰程度。当前系统熵越大,表示当前指示计算机系统中应用之间的干扰程度越大,计算机系统的性能越差。资源调度器通过比较当前系统熵与系统熵阈值之间的大小关系,以及第一LC型应用的剩余干扰容忍度与容忍度下限和容忍度上限之间的大小关系,确定进行资源调度的区域。具体来说,如果当前系统熵大于或等于系统熵阈值,且第一LC型应用的剩余干扰容忍度小于容忍度下限,那么可以认为第一LC型应用受到的干扰严重,资源紧张,需要增加第一LC型应用的第一隔离区资源。如果当前系统熵大于或等于系统熵阈值,且第一LC型应用的剩余干扰容忍度大于容忍度上限,那么可以认为当前系统的性能表现较差是由于LC型应用的隔离区资源较多导致的,因此资源调度器可以将第二LC型应用的第二隔离区资源转移至资源共享区。
[0011]本申请实施例中,结合剩余容忍度和系统熵,来确定是否进行资源调度,对资源调度的条件进行了更加严格的限定,避免了在不必要的情况下进行资源调度,节约了计算资源。
[0012]在第一方面的一些可选实施例中,资源调取器增加第一LC型应用的第一隔离区资源的方式有多种。可选的,如果计算机系统中存在剩余干扰容忍度大于容忍度上限,且具有可剥离的第三隔离区资源的第三LC型应用,那么资源调度器会将第三隔离区资源中的资源转移至第一LC型应用对应的第一隔离区,以增加第一隔离区资源。可选的,如果计算机系统中不存在这样的第三LC型应用,那么资源调度器会将资源共享区的资源转移至第一隔离区,以增加第一隔离区资源。其中,计算机系统中不存在这样的第三LC型应用包括,计算机系统中所有的LC型应用的剩余干扰容忍度都不大于容忍度上限,或者,计算机系统中所有的LC型应用都不具备可剥离的隔离区资源,或者,计算机系统中剩余干扰容忍度大于容忍度上限的LC型应用都不具备可剥离的隔离区资源,具体此处不做限定。
[0013]本申请实施例中,在增加第一LC型应用的第一隔离区资源时,优先考虑从其他LC型应用的隔离区资源中转移资源,尽可能减低对系统性能的不良影响,提升了技术方案的实用性。同时,对于不同的情况,有不同的方式增加第一隔离区资源,能够适应不同的场景,提升了本申请技术方案的灵活性和可适应性。
[0014]在第一方面的一些可选实施例中,在计算机系统中只包括LC型应用的情况下,资源调度器可以获取每个LC型应用能容忍的干扰量和每个LC型应用实际受到的干扰量。并根据每个LC型应用能容忍的干扰量和每个LC型应用实际受到的干扰量,确定当前系统熵。
[0015]在第一方面的一些可选实施例中,在计算机系统中包括LC型应用和至少一个尽力而为(best effort,BE)型应用的情况下,资源调度器可以获取来自于应用区分器或来自于用户的第一应用标识和第二应用标识,以对LC型应用和BE型应用进行区分。其中,第一应用标识用于指示LC型应用,第二应用标识用于指示BE型应用。资源调度器能够根据第一应用
标识,确定计算机系统中的LC型应用。根据第二应用标识,确定计算机系统中的BE型应用。资源调度器通过获取每个LC型应用能容忍的干扰量和每个LC型应用实际受到的干扰量,并根据每个LC型应用能容忍的干扰量和每个LC型应用实际受到的干扰量,确定多个LC型应用的熵。通过获取至少一个BE型应用中每个BE型应用单独运行时的第一每周期指令数和每个BE型应用受干扰后的第二每周期指令数,并根据第一每周期指令数和第二每周期指令数,确定至少一个BE型应用的熵。然后根据多个LC型应用的熵和至少一个BE型应用的熵,确定当前系统熵。由于LC型应用的服务质量的重要性远大于BE型应用的重要性,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种云计算系统的资源调度方法,其特征在于,所述方法应用于资源调度器,所述方法包括:获取计算机系统中包括的多个延迟敏感LC型应用中每个LC型应用的剩余干扰容忍度;从所述多个LC型应用中,获取剩余干扰容忍度最小的第一LC型应用;若所述第一LC型应用的剩余干扰容忍度小于容忍度下限,则增加所述第一LC型应用的第一隔离区资源;若所述第一LC型应用的剩余干扰容忍度大于容忍度上限,则将所述多个LC型应用中的第二LC型应用的第二隔离区资源转移至资源共享区。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取计算机系统的当前系统熵,所述当前系统熵用于当前指示所述计算机系统中应用之间的干扰程度;所述若所述第一LC型应用的剩余干扰容忍度小于容忍度下限,则增加所述第一LC型应用的第一隔离区资源,包括:若所述当前系统熵大于或等于系统熵阈值,且所述第一LC型应用的剩余干扰容忍度小于所述容忍度下限,则增加所述第一隔离区资源;所述若所述第一LC型应用的剩余干扰容忍度大于容忍度上限,则将所述多个LC型应用中的第二LC型应用的第二隔离区资源转移至资源共享区,包括:若所述当前系统熵大于或等于所述系统熵阈值,且所述第一LC型应用的剩余干扰容忍度大于所述容忍度上限,则将所述第二LC型应用的第二隔离区资源转移至资源共享区。3.根据权利要求1或2所述的方法,其特征在于,所述增加所述第一LC型应用的隔离区资源,包括:若所述计算机系统中存在剩余干扰容忍度大于所述容忍度上限,且具有可剥离的第三隔离区资源的第三LC型应用,则将所述第三隔离区资源中的资源转移至所述第一LC型应用对应的第一隔离区,以增加所述第一隔离区资源;若所述计算机系统中不存在所述第三LC型应用,则将所述资源共享区的资源转移至所述第一隔离区,以增加所述第一隔离区资源。4.根据权利要求2或3所述的方法,其特征在于,所述获取计算机系统的当前系统熵,包括:获取所述每个LC型应用能容忍的干扰量和所述每个LC型应用实际受到的干扰量;根据所述每个LC型应用能容忍的干扰量和所述每个LC型应用实际受到的干扰量,确定所述当前系统熵。5.根据权利要求2或3所述的方法,其特征在于,所述计算机系统还包括至少一个尽力而为BE型应用;在所述获取计算机系统的当前系统熵之前,所述方法还包括:获取来自于应用区分器或来自于用户的第一应用标识和第二应用标识,所述第一应用标识用于指示LC型应用,所述第二应用标识用于指示BE型应用;根据所述第一应用标识,确定所述计算机系统中的LC型应用;根据所述第二应用标识,确定所述计算机系统中的BE型应用;所述获取计算机系统的当前系统熵,包括:获取所述每个LC型应用能容忍的干扰量和所述每个LC型应用实际受到的干扰量;
根据所述每个LC型应用能容忍的干扰量和所述每个LC型应用实际受到的干扰量,确定所述多个LC型应用的熵;获取所述至少一个BE型应用中每个BE型应用单独运行时的第一每周期指令数和所述每个BE型应用受干扰后的第二每周期指令数;根据所述第一每周期指令数和所述第二每周期指令数,确定所述至少一个BE型应用的熵;根据所述多个LC型应用的熵和所述至少一个BE型应用的熵,确定所述当前系统熵。6.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:获取来自于服务质量预测器的第一调度信息或第二调度信息,所述第一调度信息指示增加所述多个LC型应用中目标LC型应用的隔离区资源,所述第二调度信息指示减少所述目标LC型应用的隔离区资源;根据所述第一调度信息,增加所述目标LC型应用的隔离区资源;或者,根据所述第二调度信息,减少所述目标LC型应用的隔离区资源。7.根据权利要求2至6中任一项所述的方法,其特征在于,所述方法还包括:获取所述计算机系统资源调度后的系统熵;若所述资源调度后的系统熵小于所述当前系统熵,则确定资源调度成功。8.一种云计算系统的资源调度方法,其特征在于,所述方法应用于服务质量预测器,所述方法包括:获取目标LC型应用对应的多个网络接收队列长度;计算所述多个网络接收队列长度的均值,得到平均网络接收队列长度;若所述平均网络接收队列长度大于长度阈值,则向资源调度器发送第一调度信息,所述第一调度信息指示增加所述目标LC型应用的隔离区资源;若所述平均网络接收队列长度小于或等于所述长度阈值,且所述多个网络接收队列长度中取值为0的网络接收队列长度在所述多个网络接收队列长度中的占比大于比例阈值,则向所述资源调度器发送第二调度信息,所述第二调度信息指示减少所述目标LC型应用的隔离区资源。9.一种应用识别方法,其特征在于,所述方法应用于应用区分器,所述方法包括:获取计算机系统中多个应用在当前阶段的多个网络总带宽平均值;根据所述多个网络总带宽平均值,确定所述多个应用在所述当前阶段的多个网络总带宽区间变异系数;若所述多个网络总带宽区间变异系数大于区间系数阈值,则获取所述多个应用在所述当前阶段的多个末尾发送/接收带宽比例与下一阶段的多个起始发送/接收带宽比例的多个差值绝对值;获取所述多个应用在所述当前阶段的前后目标时间段内的多个发送/接收带宽比例变异系数;根据所述多个差值绝对值或所述多个发送/接收带宽比例变异系数,确定所述多个应用中LC型应用的标识为第一应用标识,所述多个应用中BE型应用的标识为第二应用标识;向资源调度器发送所述第一应用标识和所述第二应用标识,以使所述资源调度器区分所述BE型应用和所述LC型应用。
10.根据权利要求9所述的方法,其特征在于,根据所述多个差值绝对值或所述多个发送/接收带宽比例变异系数,确定所述多个应用中LC型应用的标识为第一应用标识,所述多个应用中BE型应用的标识为第二应用标识,包括:从所述多个应用中,确定差值绝对值大于差值阈值,和/或,发送/接收带宽比例变异系数大于系数阈值的应用,为BE型应用;标记所述BE型应用的标识为所述第二应用标识;标记所述多个应用中所述BE型应用之外的应用的标识为第一应用标识。11.一种资源调度系统,其特征在于,所述资源调度系统包括资源调度器,所述资源调度器用于:获取计算机系统中包括的至少一个延迟敏感LC型应用中每个LC型应用的剩余干扰容忍度;从所述多个LC型应用中,获取剩余干扰容忍度最小的第一LC型应用;若所述第一LC型应用的剩余干扰容忍度小于容忍度下限,则增加所述第一LC型应用的第一隔离区资源;若所述第一LC型应用的剩余干扰容忍度大于容忍度上限,则将所述多个LC型应用中的第二LC型应用的第二隔离区资源转移至资源共享区。12.根据权利要求11所述的资源调度系统,其特征在于,所述资源调度器还用于:获取来自于应用区分器的第一应用标识和第二应用标识,所述第一应用标识用于指示LC型应用,所述第二应用标识用于指示BE型应用;根据所述第一应用标识,确定所述计算机系统中的LC型应用;根据所述第二应用标识,确定所述计算机系统中的BE型应用。13.根据权利要求12所述的资源调度系统,其特征在于,所述资源调度系统还包括所述应用区分器,所述应用区分器用于:获取计算机系统中多个应用在当前阶段的多个网络总带宽平均值;根据所述多个网络总带宽平均值,确定所述多个应用在所述当前阶段的多个网络总带宽区间变异系数;若所述多个网络总带宽区间变异系数大于区间系数阈值,则获取所述多个应用在所述当前阶段的多个末尾发送/接收带宽比例与下一阶段的多个起始发送/接收带宽比例的多个差值绝对值;获取所述多个应用在所述当前阶段的前后目标时间段内的多个发送/接收带宽比例变异系数;根据所述多个差值绝对值或所述多个发送/接收带宽比例变异系数,确定所述多个应用中LC型应用的标识为第一应用标识,所述多个应用中BE型应用的标识为第二应用标识;向所述资源调度器发送所述第一应用...

【专利技术属性】
技术研发人员:刘宇航邓鑫陈明宇包云岗俞洲
申请(专利权)人:华为云计算技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1