【技术实现步骤摘要】
基于聚类和注意力机制的集群负载预测方法及系统
[0001]本专利技术涉及计算机集群资源管理领域,更具体地,涉及一种基于聚类和注意力机制的集群负载预测方法及系统。
技术介绍
[0002]随着计算机技术的不断发展,对于计算机用户的应用,要保证功能上的完整,获取更好的资源利用率以及提升集群的运算能力并减少成本、增加利润,集群需要对这些应用进行高效的分配。集群分配算法需要未来的计算机资源负载作为决策依据,因此需要对未来的资源负载进行有效的预测。近年来,一些基于注意力机制的预测方法能较好地捕捉时间序列的中长期特征,又能高效得到未来一段时间的预测结果,适用于集群负载的预测任务。但是,基于注意力机制的算法往往有着较高的时间复杂度和空间复杂度。如果对每台机器训练并使用一个此类模型用以负载预测,会造成较高的计算资源损耗。
[0003]解决部署大量模型损耗资源的一种方法是对时间序列进行聚类。公开号为CN108415777A(公开日为2018
‑
08
‑
17)提出一种基于聚类特征提取的云计算集群任务负载 ...
【技术保护点】
【技术特征摘要】
1.基于聚类和注意力机制的集群负载预测方法,其特征在于,包括以下步骤:S1:获取计算机集群的离散时间序列,将离散时间序列分为训练集和测试集;S2:通过聚类算法,将计算机集群的离散时间序列分成k类;S3:基于注意力机制,设置k个成对的本类编码器和本类解码器,以及全局编码器;将k类离散时间序列全部输入全局编码器中进行训练,每个类的本类编码器采用本类内的离散时间序列进行训练;全局编码器和本类编码器训练完成后,将全局编码器和本类编码器的输出拼接起来,再输入到相应的本类解码器中进行训练;S4:将聚类后的测试集的离散时间序列输入到训练好的本类编码器和全局编码器中得到相应的注意力序列表示,再将本类编码器和全局编码器分别输出的注意力序列拼接后,输入相应的本类解码器中,得到集群负载预测结果。2.根据权利要求1所述的基于聚类和注意力机制的集群负载预测方法,其特征在于,所述S1步骤中,采用间隔采样的方法获取长为t计算机集群的离散时间序列X1={x
11
,x
12
,...,x
1t
},X2={x
21
,x
22
,...,x
2t
},...,X
n
={x
n1
,x
n2
,...,x
nt
},其中n为离散时间序列的数量。3.根据权利要求1所述的基于聚类和注意力机制的集群负载预测方法,其特征在于,分别训练编码器和解码器的步骤包括:S3.1:训练k个本类编码器:将聚类后的k类离散时间序列分别输入对应的k个本类编码器中,依次经过嵌入层,以及数个堆叠的自注意力层、卷积层和池化层,得到输入数据的询问矩阵、关键字矩阵和值矩阵,并对输入数据的询问矩阵、关键字矩阵和值矩阵进行矩阵乘法运算,得到注意力序列表示将注意力序列表示输入到一个预测网络中,得到k个本类编码器预测结果根据本类编码器预测结果与真实值的误差,更新k个本类编码器和预测网络的参数,重复上述训练;经过数轮训练后,得到训练好的k个本类编码器,并得到训练好的k个本类编码器输出注意力序列表示S3.2:训练全局编码器:将聚类后的离散时间序列输入到全局编码器中,依次经过全局编码器的嵌入层,以及数个堆叠的自注意力层、卷积层和池化层,得到输入数据的询问矩阵、关键字矩阵和值矩阵,并对输入数据的询问矩阵、关键字矩阵和值矩阵进行矩阵乘法运算,得到注意力序列表示A
全局编码器
;将注意力序列表示A
全局编码器
输入到一个预测网络中,得到全局编码器预测结果Z
全局编码器
;根据全局编码器预测结果Z
全局编码器
与真实值的误差,更新全局编码器和预测网络的参数,重复上述训练;经过数轮训练后,得到训练好的全局编码器,并得到全局编码器输出的注意力序列表示B
全局编码器
;S3.3:训练k个本类解码器:
将聚类后的离散时间序列,距离x
t
最近的t
′
个单位的一部分序列X
′
={x
t
‑
t
′
+1
,x
t
‑
t<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。