基于多变量分组的服务器性能预测方法技术

技术编号：18367697 阅读：35 留言：0更新日期：2018-07-05 09:19

本公开涉及基于多变量分组的服务器性能预测方法。本发明专利技术提出了一种用于多步预测企业服务器性能的方法。在高度动态的资源共享环境中，系统性能指标的准确预测是资源高效分配的关键。针对CPU负载等性能指标的预测，研究人员已提出一系列预测模型，但大部分集中在单变量和短期预测领域。该方法收集了服务器的历史性能数据，并且将其转化成多变量时间序列。在进行预测时，通过K近邻算法对历史的多变量时间序列进行搜索，找到与当前的服务器性能及资源消耗的状态最为接近的历史序列。将K个最相近的历史时间序列的后续时间序列信息合成未来服务器性能状况的预测值。

Server performance prediction method based on multivariable grouping

The present disclosure relates to a server performance prediction method based on multivariable grouping. The invention provides a method for multi-step prediction of the performance of enterprise servers. In a highly dynamic resource sharing environment, accurate prediction of system performance is the key to efficient allocation of resources. For the prediction of CPU load and other performance indicators, researchers have put forward a series of prediction models, but most of them focus on single variable and short-term forecasting. The method collects the historical performance data of the server and transforms it into a multivariate time series. In the prediction, the K nearest neighbor algorithm is used to search the history multivariable time series, and find the most close to the current server performance and the state of resource consumption. The subsequent time series information of the closest K historical time series is used to synthesize the predicted value of future server performance.

全部详细技术资料下载

【技术实现步骤摘要】
基于多变量分组的服务器性能预测方法
本专利技术涉及信息
中的多变量服务器负载预测方法。
技术介绍
目前，已有许多研究通过时间序列预测算法对服务器性能进行预测。这些研究有的使用了经典的线性回归、指数平滑或者ARIMA模型进行时间序列预测，也有的使用了更为复杂的支持向量机(SVM)、神经网络以及模糊逻辑算法。KNN算法也在时间序列预测中得到了使用。但是现有的服务器性能预测都是针对的单一指标，而忽略了实际中对多个指标预测的需求以及指标间的相关性；另一方面，这些预测针对的是下一步的数据，无法对未来多个步长的数据进行准确的预测。
技术实现思路
本专利技术的技术解决问题：1.基于多维K近邻方法获取多步性能预测通过多维K近邻方法能够预测多步性能信息，扩大了预测的范围。2.通过维度分组提高预测速度随着时间序列维度的增加，进行时间序列预测的速度会急剧下降。如果预测算法运行时间过长，则失去了实时预测的能力。通过变量分组提高了预测速度。3.通过维度分组，保留了变量间的相关性当多元时间序列的维度很多时，直接进行KNN预测反而由于变量之间的干扰而产生很大误差。通过维度分组，保留了变量间的相关性，又提高了速度。本专利技术的技术解决方案：为了综合利用各个指标信息以提高预测的精度，本专利技术提出一种基于多变量分组的K最近邻算法的服务器性能预测方法。通过分析各变量间的相关性对变量进行分组，在此基础上利用K最近邻法搜索相似历史序列，进行多步预测。本专利技术与现有技术相比的优点在于：使用了多维K最近邻方法实现对服务器的多步性能预测。同时，将变量按相关性、依赖性进行分组，使得每个组内的变量联系...
基于多变量分组的服务器性能预测方法

【技术保护点】
1.一种为企业计算机系统预报网络资源需求的计算机实现的方法，其中所述企业计算机系统包括为所述企业计算机系统的用户托管计算机资源的多个网络服务器，所述方法包括：通过计算机数据库系统，接收所述多个网络服务器的多元时间序列(MTS)性能数据，其中所述MTS性能数据包括针对一系列先前采样时刻的、用于所述多个网络服务器的多个d性能变量的数据；通过与所述计算机数据库系统通信的已编程的计算机系统，将所述MTS性能数据中的变量分组成为两个或更多个变量组，使得所述MTS性能数据中的所述性能变量中的每一个属于一个变量组；通过已编程的计算机系统，通过计算在一个或多个未来时间范围步长处的对所述变量的预测，来计算所述企业计算机系统的所述网络服务器的未来工作负载的预测，其中计算所述预测包括：使用应用到所述两个或更多个变量组的k最近邻搜索算法，寻找相对于所述MTS性能数据的基准状态的k个最近邻；以及计算所述k个最近邻的加权平均；以及通过已编程的计算机系统，基于所计算的预测，确定网络服务器的推荐数量，这是所述企业需要处于工作模式中、以处理在所述一个或多个未来时间范围步长中的每一个未来时间范围步长处的所述企业计算机系统...

【技术特征摘要】
1.一种为企业计算机系统预报网络资源需求的计算机实现的方法，其中所述企业计算机系统包括为所述企业计算机系统的用户托管计算机资源的多个网络服务器，所述方法包括：通过计算机数据库系统，接收所述多个网络服务器的多元时间序列(MTS)性能数据，其中所述MTS性能数据包括针对一系列先前采样时刻的、用于所述多个网络服务器的多个d性能变量的数据；通过与所述计算机数据库系统通信的已编程的计算机系统，将所述MTS性能数据中的变量分组成为两个或更多个变量组，使得所述MTS性能数据中的所述性能变量中的每一个属于一个变量组；通过已编程的计算机系统，通过计算在一个或多个未来时间范围步长处的对所述变量的预测，来计算所述企业计算机系统的所述网络服务器的未来工作负载的预测，其中计算所述预测包括：使用应用到所述两个或更多个变量组的k最近邻搜索算法，寻找相对于所述MTS性能数据的基准状态的k个最近邻；以及计算所述k个最近邻的加权平均；以及通过已编程的计算机系统，基于所计算的预测，确定网络服务器的推荐数量，这是所述企业需要处于工作模式中、以处理在所述一个或多个未来时间范围步长中的每一个未来时间范围步长处的所述企业计算机系统的所述用户的资源请求的网络服务器的推荐数量。2.如权利要求1所述的方法，其中所述多个网络服务器的所述性能变量包括指示至少以下内容的变量：CPU负载；基础计算机存储器使用量；以及每单位时间段次级计算机存储装置的输入/输出(IO)操作。3.如权利要求1所述的方法，其中将所述变量分组的步骤包括：通过所述已编程的计算机系统，计算指示每一对性能变量之间的相关性的相关矩阵；以及通过所述已编程的计算机系统，使用聚类算法基于所述相关矩阵确定所述变量组。4.如权利要求3所述的方法，其中所述相关矩阵包括斯皮尔曼相关矩阵。5.如权利要求4所述的方法，其中所述聚类算法包括近邻传播聚类算法。6.如权利要求1所述的方法，其中寻找相对于所述MTS性能数据的所述基准状态的所述k个最近邻的步骤包括：分别计算代表所述MTS的所述基准状态的向量和代表在先前采样时刻处的所述MTS数据的多个向量中的每一个向量之间的距离；以及确定针对先前采样时刻的、相对于代表所述MTS的所述基准状态的向量具有最小距离的k个向量。7.如权利要求6所述的方法，其中计算距离包括计算欧氏距离。8.如权利要求1所述的方法，还包括：通过所述已编程的计算机系统发送数据，所述数据指示所述企业需要处于工作模式中以处理针对所述未来时间范围步长中的至少一个未来时间范围步长的、所述企业计算机系统的所述用户的所述资源请求的网络服务器的所述推荐数量；以及通过与所述已编程的计算机系统通信的一个或多个代理计算机系统指令所述网络服务器，使得所述推荐数量的网络服务器处于工作模式中以处理针对所述至少一个未来时间范围步长的、所述用户的所述资源请求...

【专利技术属性】
技术研发人员：R·W·马丁，张宏斌，曹健，
申请(专利权)人：摩根士丹利服务集团有限公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人