基于改进TFT的云服务器资源利用数量预测方法技术

技术编号:32830921 阅读:14 留言:0更新日期:2022-03-26 20:43
本发明专利技术提供了一种云服务器资源利用数量预测的方法。该方法改进TFT(时序融合变压器)多步时间序列预测技术,应用在云服务器资源利用数量的预测中。所述方法包括:数据集特征变量分解;生成训练集测试集;数据特征变量划分;设计并改进TFT预测模型;不同的数据特征变量进入模型相应接口;模型训练;生成目标预测模型;模型测试。本发明专利技术提供了新的变量分解方法,并利用TFT变量分类提取和多步融合预测的优势,在改进算法之后加快了模型拟合速度,提升了预测准确度和鲁棒性。该发明专利技术解决了目前云服务器资源利用的数据由于特征变量过少,多步预测准确度低的技术问题,满足了云服务平台通过对服务器资源利用数量的预测进行安全部署、资源协调的需求。源协调的需求。源协调的需求。

【技术实现步骤摘要】
基于改进TFT的云服务器资源利用数量预测方法


[0001]本专利技术属于通信
,尤其是涉及一种基于改进TFT(时序融合变压器模型)的云服务器资源利用数量预测方法。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]云服务平台是在一定的网络环境下,服务商为企业提供大规模计算的服务平台。当前一些传统的性能分析方法无法很好地解决云服务平台部署、资源利用、架构和技术等方面的挑战,通过对服务器资源利用数量的准确预测可以在一定程度上解决这些问题。对云平台服务器的资源利用数量进行预测,一方面,可以对未来可能面对的平台用户高峰期做出预判,提前进行部署从而防止服务器过载以及保证访问安全;另一方面,还可以在资源利用低迷期减少服务器的投入,从而降低资源的损耗。
[0004]然而,云平台后台产生的云服务器使用情况数据,其原始数据仅有一列与时间戳对应的变量数据,使得预测存在局限性,预测时无法精准提取特征,传统模型能学习到的东西少之又少,最后致使结果不准确。传统的单变量预测方法一般为应用前几步的数据来作为模型输入,后一步或后几步的数据作为模型标签进行训练,由于缺少特征变量而导致预测结果不够准确。当前,多变量的时间序列预测研究一直比较热门,但是无法用在云服务器资源利用数量的单变量数据中。一些传统预测模型,如:ARMA(自回归滑动平均模型)、ARIMA(求和自回归滑动平均模型)、LSTM(长短期记忆循环神经网络),是现在的数据分析者比较青睐的预测技术,但是这些技术仍然存在结构不完善、特征提取不准确、模型拟合慢、结果不准确、资源消耗大等不足,不能满足当前市场的需要。
[0005]如何使最新的多变量预测技术应用在云服务器资源利用数量预测领域,怎样提取特征和提升预测准确度以满足资源精确部署的需求,是当前研究的重点。

技术实现思路

[0006]为解决以上问题,本专利技术提供了一种云服务器资源利用数量预测方法。本专利技术的实施例提供了如下技术方案:应用Prophet的时间序列分解功能,对原始数据的时间戳和对应的值进行特征变量分解,获得整体趋势项等变量;手动增加年、月、周、日、节日、季节的时间项,用于扩充原始数据集作为模型输入数据;将数据划分为三种变量输入到TFT模型的不同接口中,对其特征进一步计算分析;使用encoder(编码器)和decoder(解码器)对变量进行编码解码;改进注意力机制学习特征变量,最终输出预测结果。改进的TFT模型大大提高了模型拟合速度和提升了服务器利用数量数据预测的准确性。
[0007]具体步骤包括:s1:获取一段时间内云服务器资源利用数量的数据进行特征变量提取和分解,通过基于时间序列分解的预测模型Prophet,使两列原始数据(时间戳和实际变量值)的特征
变量扩增到多列。
[0008]s2:将所述Prophet模型输出的值进行选择性提取,提取输入值对应的时间戳和实际值,并获取所述Prophet模型计算的趋势项动态变量,得到新数据集。
[0009]s3:对新数据集进一步手动扩充时间序列变量,增加年、月、日、星期、周末、节日、季节项,最终使两列原始数据扩充为多列数据,形成多变量数据集作为模型输入。
[0010]s4:把所述多变量输入数据的特征变量划分为三类,分别为静态季节变量、过去观测变量、已知时间变量。
[0011]s5:设计并改进TFT模型,改进变量选择模块中的GLU(门控线性单元)层,实现增强对过去信息选择性获取和遗忘的功能,其计算公式为:公式一:其中所述W1,W2,W3为待训练的权重参数,所述b、c,d为待训练的偏置参数,gelu()为激活函数gelu,为矩阵乘法计算。
[0012]s6:改进TFT模型中的注意力计算方式,使用双头注意力机制,Q,K,V为输入的embedding分别乘上一个权重矩阵得到的query、key、value,首先对K进行采样,随机选择n个K,得到K
n
,对q
i
∈Q关于Kn求M值,公式如下:公式二:其中q
i
∈Q,k
j
∈K
n
找到M中最大的n个q
i
,组成Q
n ,关于K
n
求A(Q
n
,K
n
,V),公式如下:公式三:其中Q
n
为选中的n个q
i
组成的矩阵,没有选中的q
i
求A(Q,K,V)后求均值初始化为原始Q
r
矩阵,Q
n
矩阵中非0值更新到Q
r
矩阵中得到最终Q矩阵;求双头注意力公式如下:公式四:公式五:注意力机制最后输出值。
[0013]s7:根据所述步骤s5和所述步骤s6中的改进建立新的TFT预测模型。
[0014]s8:将所述步骤s4中划分的静态季节变量、过去观测变量、时间已知变量分别接入模型对应的静态协变量、动态时变特征变量、动态时不变特征的输入数据的接口,使模型对不同的变量进行不同的特征选择和计算。
[0015]s9:训练模型,设置epoch的数量为40,decoder预测时间步为165,进行模型训练和建立。
[0016]s10:从测试集上进行测试,验证建立模型的准确度。
[0017]进一步的技术方案,所述步骤s2中Prophet模型只用于数据处理,使用Prophet的
预测模型进行时间序列特征变量的分解操作,作为模型的输入,只保留原数据中的节点,对该模型的预测结果不做使用。
[0018]进一步的技术方案,所述步骤s3中的手动扩充时间特征变量可以根据数据的实际情况,增加相应的影响数据结果的某节日项。
[0019]进一步的技术方案,所述步骤s4中静态季节变量为当前所在时间点的季节特征项,过去观测变量为预测点之前的已知观测到的动态变量,已知时间变量为整个预测体系中都已知的时间变量如年、月、周、日等。
[0020]进一步的技术方案,所述步骤s5中是应用门控线性单元对数据特征进行选择性记忆和遗忘的计算方法。
[0021]更进一步的技术方案,所述步骤s6中的所有公式需配套使用,相互计算。
[0022]更进一步的技术方案,所述步骤s8中把季节变量作为静态协变量输入到模型中,使季节变量可以协调全局的特征。
[0023]本专利技术提供的一种云服务器资源利用数量的预测方法,满足了云服务平台要对未来进行服务器精准部署的需求,解决了特征分解的瓶颈问题,改进的TFT(时序融合变压器)多步时间序列预测模型作为基础框架,改进其中的组件和计算方式,提高了云服务器资源利用数量预测的准确度。通过对服务器使用数量的预测,提高的云服务平台的运维效率,使平台维护者更准确地对各项资源进行调度。
附图说明
[0024]为了更清楚的说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进TFT的云服务器资源利用数量预测方法,其特征在于,包括:s1:获取一段时间内云服务器资源利用数量的数据进行特征变量提取和分解,通过基于时间序列分解的预测模型Prophet,使两列原始数据(时间戳和实际变量值)的特征变量扩增到多列;s2:将所述Prophet模型输出的值进行选择性提取,提取输入值对应的时间戳和实际值,并获取所述Prophet模型计算的趋势项动态变量,得到新数据集;s3:对新数据集进一步手动扩充时间序列变量,增加年、月、日、星期、周末、节日、季节项,最终使两列原始数据扩充为多列数据,形成多变量数据集作为模型输入;s4:把所述多变量输入数据的特征变量划分为三类,分别为静态季节变量、过去观测变量、已知时间变量;s5:设计并改进TFT模型,改进变量选择模块中的GLU(门控线性单元)层,实现增强对过去信息选择性获取和遗忘的功能,其计算公式为:公式一:其中所述W1,W2,W3为待训练的权重参数,所述b、c,d为待训练的偏置参数,gelu()为激活函数gelu, 为矩阵乘法计算;s6:改进TFT模型中的注意力计算方式,使用双头注意力机制,Q,K,V为输入的embedding分别乘上一个权重矩阵得到的query、key、value,首先对K进行采样,随机选择n个K,得到Kn,对qi∈Q关于Kn求M值,公式如下:公式二: 其中qi∈Q,kj∈Kn找到M中最大的n个qi,组成Qn ,关于Kn求A(Qn,Kn,V),公式如下:公式三: 其中Qn为选中的n个qi组成的矩阵,没有选中的qi求A(Q,K,V)后求均值初始化为原始Qr矩阵,Qn矩阵中非0值更新到Qr矩阵...

【专利技术属性】
技术研发人员:李敏陈庆辉李刚周鸣乐刘一鸣刘千龙
申请(专利权)人:山东省计算中心国家超级计算济南中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1