计算节点集群中的工作负载之间的交叉干扰的识别制造技术

技术编号:15541207 阅读:119 留言:0更新日期:2017-06-05 10:43
本公开涉及计算节点集群中的工作负载之间的交叉干扰的识别。一种包括监视在多个计算节点上运行的多个工作负载的性能的方法。建立关于工作负载中的至少一些工作负载的相应的异常性能事件的时间序列。通过比较时间序列中的两个或更多个时间序列,将选择出的工作负载布置在选择出的计算节点上,从而降低在工作负载中的两个或更多个工作负载之间的交叉干扰。

Identification of cross interference between workloads in a cluster of nodes

The present disclosure relates to the identification of cross interference between workloads in a computing node cluster. A method includes monitoring the performance of a plurality of workloads running on multiple computing nodes. Establish a time series of the corresponding abnormal performance events about at least some workloads in the workload. By comparing the time sequence of two or more time series, will choose the work load in the calculation of the selected node layout, thereby reducing the interference between two or more in the work load.

【技术实现步骤摘要】
计算节点集群中的工作负载之间的交叉干扰的识别相关申请的交叉引用本申请要求提交于2015年11月22日的美国临时专利申请62/258,473的权益,其公开内容通过引用并入本文。专利
本专利技术总体涉及计算节点集群,并且具体来说,涉及用于工作负载的布置的方法和系统。专利技术背景机器虚拟化经常用于各种计算环境,诸如用于数据中心和云计算。在本领域中已知各种虚拟化方案。例如,VMware公司(加利福尼亚,帕洛阿尔托)提供了用于诸如数据中心、云计算、个人台式机和移动计算的环境的虚拟化软件。专利技术概述在本文中描述的本专利技术的实施例提供了包括监视在多个计算节点上运行的多个工作负载的性能的方法。针对工作负载中的至少一些工作负载,建立了异常性能事件的相应的时间序列。通过比较时间序列中的两个或更多个时间序列,将选择出的工作负载布置在选择出的计算节点上,从而降低在工作负载中的两个或更多个工作负载之间的交叉干扰。在一些实施例中,比较时间序列包括:通过检测第一工作负载和第二工作负载的相应的第一时间序列和第二时间序列展示异常性能事件的同步发生,识别在第一工作负载和第二工作负载之间的交叉干扰。在实施例中,布置选择出的工作负载包括:响应于识别到交叉干扰,将第一工作负载和第二工作负载中的一个工作负载迁移到不同的计算节点。在另一实施例中,该方法还包括:识别异常性能事件中的一些异常性能事件与交叉干扰不相关,并且从时间序列的比较中忽略所识别出的异常性能事件。在一些实施例中,比较时间序列包括:通过将多对时间序列进行比较,评估在第一类型的工作负载和第二类型的工作负载之间典型的交叉干扰,其中,每对包括第一类型的时间序列和第二类型的时间序列。在示例实施例中,布置选择出的工作负载包括:制定第一类型的工作负载的和第二类型的工作负载的布置规则。在所公开的实施例中,比较多对时间序列是在多个第一类型的工作负载上、多个第二类型的工作负载上以及多个计算节点上执行的。在实施例中,比较时间序列包括:通过相应的签名表示时间序列,并且比较签名。根据本专利技术的实施例,另外提供了包括接口和一个或多个处理器的系统。接口被配置成用于与多个计算节点进行通信。处理器被配置成监视在多个计算节点上运行的多个工作负载的性能,以建立关于工作负载中的至少一些工作负载的异常性能事件相应的时间序列,并且通过比较时间序列中的两个或更多个时间序列,将选择出的工作负载布置在选择出的计算节点上,从而降低在工作负载中的两个或更多个工作负载之间的交叉干扰。根据本专利技术的实施例,还提供了一种计算机软件产品,该产品包括程序指令储存于其中的有形的非暂时性计算机可读介质,该指令在由一个或多个处理器读取的时候,使得一个或多个处理器监视在多个计算节点上运行的多个工作负载的性能,以建立关于工作负载中的至少一些工作负载的异常性能事件的相应的时间序列,并且通过比较时间序列中的两个或更多个时间序列,将选择出的工作负载布置在选择出的计算节点上,从而降低在工作负载中的两个或更多个工作负载之间的交叉干扰。根据以下结合附图进行的本专利技术的实施例的详细描述,本专利技术将被更彻底地理解,其中:附图简述图1为根据本专利技术的实施例示意性示出计算系统的方框图;图2为根据本专利技术的实施例示意性示出图1中的计算系统的元素的方框图;图3为根据本专利技术的实施例,示出在一段时间中异常的VM性能的示例的曲线图;并且图4为根据本专利技术的实施例,示意性示出用于基于在一段时间中异常性能的比较进行的VM布置的方法的流程图。具体实施方式概述本专利技术的实施例提供了用于在包括多个互连的计算节点的系统中的工作负载的布置的改进技术。每个工作负载消耗其运行所在的计算节点的物理资源,例如,存储器、储存器、CPU和/或网络资源。在系统中运行的工作负载通常是各种类型的,并且每种类型的工作负载的特征在于资源消耗的不同分布。在相同节点上运行的工作负载可能造成相互交叉干扰,例如,在相同时间的资源竞争的时候。工作负载布置决定对于系统中的交叉干扰的程度具有相当大的影响,并且因此对于整个系统性能具有相当大的影响。然而,交叉干扰的程度是极为难以被估计或者预测的。例如,在运行大量工作负载的计算节点中,识别造成交叉干扰的工作负载、以及受此影响的工作负载是极为复杂的。在本文中描述的技术识别了有可能造成相互交叉干扰的工作负载的类型。这个识别是基于在各种工作负载中发生的异常性能事件的检测和相互关系。潜在的假设是:在大约相同时间经历异常性能事件的工作负载同样有可能遭受相互的交叉干扰。通常应将这些工作负载分离,并且并不放置在相同的计算节点。在一些实施例中,系统在一段时间中监视各种工作负载的性能,并且识别异常性能事件。异常性能事件通常涉及工作负载脱离其基线或者期望性能的短周期时间。对于工作负载中的至少一些工作负载,该系统建立了异常性能事件的相应的时间序列。通过比较不同工作负载的时间序列,该系统识别了有可能造成相互交叉干扰的工作负载(通常是成对的工作负载)。通常,在其中在大致相同的时间发生异常性能事件的工作负载被怀疑为具有交叉干扰,并且反之亦然。在一些实施例中,系统通过在长时间周期中以及在多个计算节点上检查时间序列,来评估可能的交叉干扰。通常,交叉干扰关系是在工作负载的类型之间被确定的,而不是在各个工作负载实例之间被确定的。然后,交叉干扰评估被用于以降低在工作负载之间的交叉干扰的方式布置工作负载。应注意到,所公开的技术识别并比较在各个工作负载中发生的异常性能事件,而与在计算节点中的异常资源消耗作为整体截然不同。正因如此,所公开的技术几乎不检测潜在的布置问题或者瓶颈,但仍然提供用于解决潜在的布置问题或者瓶颈的可操作的信息。在本文中描述的方法和系统对于识别并且降低在工作负载之间的交叉干扰高度有效。作为结果,资源(诸如,存储器、储存器、网络和计算能力)被有效利用。所公开的技术有助于广泛的各种环境中,例如,在其中交叉干扰造成租户为他们并没有使用的计算资源付费的多租户数据中心中。虽然在本文中描述的实施例主要指的是虚拟机(VM)的布置,然而,所公开的技术可以以类似的方式被用于其他类型的工作负载(诸如,操作系统容器和过程)的布置。所公开的技术对于工作负载的初始布置以及对于工作负载迁移均有用。此外,虽然在本文中描述的实施例主要指的是在给定的计算节点中的VM之间的交叉干扰的检测,但是所公开的技术可以以类似的方式被用于例如在给定的VM中的容器之间的交叉干扰的检测,或者在给定的计算节点集群中的计算节点之间的交叉干扰的检测。系统描述图1是根据本专利技术的实施例示意性示出计算系统20的方框图,计算系统20包括许多计算节点24的集群。例如,系统20可包括数据中心、云计算系统、高性能计算(HPC)系统、或任何其他合适的系统。计算节点24(为了简洁,而被简称为“节点”)通常包括服务器,但可以可选地包括任何其他合适类型的计算节点。系统20可包括任何合适数量的节点,这些节点或是相同类型,或是不同类型。节点24也被称为物理机器。节点24由通常是局域网(LAN)的通信网络28连接。网络28可根据任何合适的网络协议(诸如,以太网或Infiniband)运行。在本文描述的实施例中,网络28包括互联网协议(IP)网络。每个节点24均包括中央处理单元(CPU)32。根据计算节点的本文档来自技高网...
计算节点集群中的工作负载之间的交叉干扰的识别

【技术保护点】
一种方法,包括:监视在多个计算节点上运行的多个工作负载的性能;建立关于所述工作负载中的至少一些工作负载的相应的异常性能事件的时间序列;以及通过比较所述时间序列中的两个或更多个时间序列,来将选择出的工作负载布置在选择出的计算节点上,从而降低在所述工作负载中的两个或更多个工作负载之间的交叉干扰。

【技术特征摘要】
2015.11.22 US 62/258,4731.一种方法,包括:监视在多个计算节点上运行的多个工作负载的性能;建立关于所述工作负载中的至少一些工作负载的相应的异常性能事件的时间序列;以及通过比较所述时间序列中的两个或更多个时间序列,来将选择出的工作负载布置在选择出的计算节点上,从而降低在所述工作负载中的两个或更多个工作负载之间的交叉干扰。2.根据权利要求1所述的方法,其中,比较所述时间序列包括:通过检测第一工作负载和第二工作负载的相应的第一时间序列和第二时间序列展示所述异常性能事件的同步发生,来识别在所述第一工作负载和所述第二工作负载之间的交叉干扰。3.根据权利要求2所述的方法,其中,布置所述选择出的工作负载包括:响应于识别所述交叉干扰,将所述第一工作负载和所述第二工作负载中的一个工作负载迁移到不同的计算节点。4.根据权利要求2所述的方法,还包括识别所述异常性能事件中的一些异常性能事件与交叉干扰不相关,并且从所述时间序列的比较中忽略所识别出的异常性能事件。5.根据权利要求1所述的方法,其中,比较所述时间序列包括:通过比较多对时间序列,评估在第一类型的工作负载和第二类型的工作负载之间典型的交叉干扰,其中,每对包括所述第一类型的时间序列和所述第二类型的时间序列。6.根据权利要求5所述的方法,其中,布置所述选择出的工作负载包括:制定所述第一类型的工作负载的和所述第二类型的工作负载的布置规则。7.根据权利要求5所述的方法,其中,比较所述多对时间序列是在所述第一类型的多个工作负载上、所述第二类型的多个工作负载上以及多个所述计算节点上执行的。8.根据权利要求1所述的方法,其中,比较所述时间序列包括:通过相应的签名来表示所述时间序列,并且比较所述签名。9.一种系统,包括:接口,用于与多个计算节点进行通信;以及一个或多个处理器,所述一个或多个处理器被配置成监视在所述多个计算节点上运行的多个工作负载的性能、建立关于所述工作负载中的至少一些工作负载的异常性能事件的相应的时间序列,以及通过比较所述时间序列中的两...

【专利技术属性】
技术研发人员:本诺特·纪尧姆·查尔斯·胡德奇亚亚历山大·索尔佳尼克
申请(专利权)人:斯特拉托斯卡莱有限公司
类型:发明
国别省市:以色列,IL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1