当前位置: 首页 > 专利查询>利兹大学专利>正文

数据中心利用率预测系统和方法技术方案

技术编号:24597201 阅读:38 留言:0更新日期:2020-06-21 03:45
一种数据中心利用率预测系统(200),包括被配置成从数据中心利用率信息确定多个数据中心虚拟行为模式的行为分析器(210)和数据中心利用率预测器(220),该数据中心利用率预测器(220)被配置成基于所确定的数据中心虚拟行为模式、数据中心策略信息和/或表示数据中心的硬件和/或软件部件的基础设施数据来计算至少一个数据中心利用率度量。因此,提供利用率预测,其不仅考虑数据中心的物理基础设施,而且还考虑虚拟行为模式。

Data center utilization prediction system and method

【技术实现步骤摘要】
【国外来华专利技术】数据中心利用率预测系统和方法领域本专利技术涉及数据中心利用率预测系统。本专利技术进一步涉及预测数据中心利用率的方法。背景例如通过提供云计算资源、充当协同定位中心或提供大量存储来支持现代IT的数据中心是极其复杂的系统之系统。此类数据中心的基础设施包括大量交互作用部件,包括物理部件(例如计算硬件、联网硬件、配电系统和冷却系统)、软件部件(例如虚拟化软件、调度软件、联网软件、安全软件、监控软件以及作为用户指定的任务或作业的一部分执行的软件)以及业务流程部件(例如服务级别协议、服务质量策略和安全策略)。图1示出了典型数据中心100的部件——包括示例性物理部件110、电源管理部件120、虚拟/软件部件130和业务流程140——的示意图。将明显的是,无数交互作用出现在部件110-140中的每一个(以及它们的相应子部件)之间,这导致了极大的复杂性。因此,当例如通过改变或升级部件或通过改变相关策略来对数据中心100的组成进行改变时,困难产生,因为该改变的总体效应由于所涉及的复杂交互作用而不能容易地被计算。未预见到的结果的潜在性与数据中心的业务关键性质结合而导致不必要的保守设计选择。因此,典型数据中心的平均利用率低至10%,导致相当大数量的浪费的资源、差的能量效率以及不必要的资本和运营费用。为了尝试预测对数据中心基础设施做出的变化的结果,大多数数据中心运营商使用电子数据表来手动地预测和管理它们的设施,或者使用仅基于数据中心的物理特性进行监控和预测的预测性DCIM(数据中心基础设施管理)工具。例如,在一种现有技术方法中,监督机器学习用于通过将整个现有数据中心的物理特性表示为由特征向量表示的单个数据点来预测数据中心性能。示例特征可以包括CPU的数量、RAM的数量、磁盘存储的数量等。因此,对于给定的工作负荷,可以预测适当数量的所需物理资源。然而,这种建模是相对粗粒度的,且没有考虑到上面所述的复杂交互作用。本专利技术的目的是克服上面概述的缺点以及从本文的描述对本领域中的技术人员明显的任何其他缺点。本专利技术的另一个目的是提供预测基础设施变化对数据中心的影响的准确手段。概述根据本专利技术,提供了如在所附权利要求中阐述的装置和方法。本专利技术的其它特征从从属权利要求和接下来的描述中将是明显的。根据本专利技术的第一方面,提供了数据中心利用率预测系统,其包括:行为分析器,其被配置成从数据中心利用率信息确定多个数据中心虚拟行为模式;以及数据中心利用率预测器,其被配置成基于所确定的数据中心虚拟行为模式、数据中心策略信息和/或表示数据中心的硬件和/或软件部件的基础设施数据来计算至少一个数据中心利用率度量。每个虚拟行为模式可以表示下列项中的一个或更多个的子集的行为:数据中心的服务器;在数据中心中运行的软件任务或数据中心的用户。数据中心利用率信息可以包括数据中心跟踪日志。数据中心利用率信息可以包括与计算元件利用率、存储器利用率、冷却利用率、磁盘利用率、功率消耗和/或热产生中的一个或更多个相关的数据。计算元件可以包括中央处理单元(CPU)、图形处理单元(GPU)、现场可编程门阵列(FPGA)中的一个或更多个。数据中心信息可以包括关于由一个或更多个用户提交的一个或更多个任务的数据。数据中心信息可以包括与由每个用户为每个任务请求的资源相关的数据,并且优选地包括完成每个任务实际上所需的资源的实际数量。数据中心信息可以包括完成每个任务所需的时间的长度。数据中心利用率信息可以包括在当前时间之前的滑动时间窗口上捕获的信息。行为分析器可以被配置成使用机器学习、优选地无监督机器学习来确定数据中心虚拟行为模式。行为分析器可以被配置成通过聚集服务器、软件任务或用户中的一个或更多个使用机器学习来确定数据中心虚拟行为模式。行为分析器可以被配置成使用K均值聚类。行为分析器可以被配置成通过对多个k值进行聚类并且选择k的值来选择聚类的最佳数量,其中聚类的可变性低于预定阈值。行为分析器可以计算一个或更多个特征以表示数据中心利用率信息的每个服务器、任务或用户。这些特征可以包括表示优选地在预定时间段内例如每小时或每5分钟由用户提交的任务的数量的提交率。特征可以包括每任务的计算元件的所请求的数量和/或每任务的存储器的所请求的数量。任务可以由执行的长度、计算元件利用率和存储器利用率中的一个或更多个表示。行为分析器可操作来周期性地确定多个数据中心虚拟行为模式。利用率预测器可以包括环境生成器,环境生成器被配置成基于数据中心策略信息和/或基础设施数据来生成模拟数据中心的模拟部件。基础设施数据可以包括模拟数据中心的模拟物理部件的信息,优选地包括下列项中的一个或更多个:服务器的数量和每服务器的计算元件和存储器的数量、物理分布数据和冷却数据。基础设施数据可以包括功率系统数据,优选地包括功率可用性数据、备份系统数据和能量效率数据中的一个或更多个。基础设施数据可以包括虚拟和软件数据,优选地包括服务器虚拟化数据。数据中心策略信息可以包括调度策略。数据中心策略信息和/或基础设施数据可以被递归地定义,使得数据中心策略信息和/或基础设施数据的元素可以在细节的不同级别处被定义。环境生成器可以被配置成优选地通过基于行为模式生成用户和/或任务和/或服务器来生成数据中心的模拟工作负荷。可以基于一个或更多个概率分布来生成模拟工作负荷。环境生成器可以被配置成基于数据中心利用率信息来确定概率分布。利用率预测器可以包括被配置成在模拟部件上执行模拟工作负荷的模拟引擎。模拟引擎可以包括可操作来优选地使用装箱算法来调度模拟工作负荷的调度器。利用率预测器可以包括监控单元,监控单元可操作来从模拟数据中心收集数据并基于所收集的数据来生成至少一个数据中心利用率度量。监控单元可以包括一个或更多个监控元件,每个监控元件被包括在模拟数据中心的模拟部件中。至少一个数据中心利用率度量可以是下列项中的一个或更多个:能量消耗数据、能量效率数据、每服务器的资源利用率和分配、事件时间戳以及每任务的资源请求和利用率。根据本专利技术的第二方面,提供了预测数据中心利用率的计算机实现的方法,其包括:通过分析数据中心利用率信息来确定多个虚拟行为模式;指定表示数据中心的硬件和/或软件部件的基础设施数据;以及基于所确定的虚拟行为模式、数据中心策略信息和/或基础设施数据来计算至少一个数据中心利用率度量。第二方面的方法的另外的优选特征在上文中关于第一方面的系统被定义,并且可以以任何组合被组合。根据本专利技术的第三方面,提供了一种计算机可读介质,其具有被记录在其上的指令,指令在被执行时使计算设备执行在第二方面中定义的方法。计算机可读介质可以是非暂时性的。第三方面的计算机可读介质的另外的优选特征在上文中关于第一方面的系统被定义,并且可以以任何组合被组合。根据本专利技术的第四方面,提供了一种计算机程序产品,其包括用于使计算设备执行在第二方面中定义的方法的计算机程序代码。第四方面的计算机程序产品的另外的优选特征在上文中关于第一方面的系统被本文档来自技高网...

【技术保护点】
1.一种数据中心利用率预测系统,包括:/n行为分析器,其被配置成从数据中心利用率信息确定多个数据中心虚拟行为模式;以及/n数据中心利用率预测器,其被配置成基于所确定的数据中心虚拟行为模式、数据中心策略信息和/或表示数据中心的硬件和/或软件部件的基础设施数据来计算至少一个数据中心利用率度量。/n

【技术特征摘要】
【国外来华专利技术】20170712 GB 1711223.61.一种数据中心利用率预测系统,包括:
行为分析器,其被配置成从数据中心利用率信息确定多个数据中心虚拟行为模式;以及
数据中心利用率预测器,其被配置成基于所确定的数据中心虚拟行为模式、数据中心策略信息和/或表示数据中心的硬件和/或软件部件的基础设施数据来计算至少一个数据中心利用率度量。


2.根据权利要求1所述的系统,其中每个数据中心虚拟行为模式表示下列项中的一个或更多个的子集的行为:
所述数据中心的服务器;
在所述数据中心中运行的软件任务;
所述数据中心的用户;
包括在所述数据中心中运行的多个软件任务的作业;
包括多个服务器的机架;或者
虚拟机或容器。


3.根据权利要求1或2所述的系统,其中所述数据中心利用率信息包括数据中心跟踪日志。


4.根据任一前述权利要求所述的系统,其中所述数据中心利用率信息包括与计算元件利用率、存储器利用率、磁盘利用率、冷却利用率、功率消耗和/或热产生中的一个或更多个相关的数据。


5.根据任一前述权利要求所述的系统,其中所述数据中心利用率信息包括关于由一个或更多个用户提交的一个或更多个任务的数据、与每个用户为每个任务请求的资源相关的数据以及完成每个任务实际上所需的资源的实际数量。


6.根据任一前述权利要求所述的系统,其中所述行为分析器被配置成通过聚集所述服务器、所述软件任务或所述用户中的一个或更多个来确定所述数据中心虚拟行为模式。


7.根据权利要求6所述的系统,其中所述行为分析器被配置成通过对多个k值进行聚类来选择最佳数量的聚类,并且选择k的值,其中所述聚类的可变性低于预定阈值。


8.根据任一前述权利要求所述的系统,其中行为分析器被配置成计算一个或更多个特征以表示所述数据中心利用率信息的每个服务器、任务或用户,所述特征包括下列项中的一个或更多个:
提...

【专利技术属性】
技术研发人员:P·M·汤恩德徐洁伊斯梅尔·索利斯莫雷诺
申请(专利权)人:利兹大学
类型:发明
国别省市:英国;GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1