【技术实现步骤摘要】
一种基于数据增强的数据中心故障预测方法
本专利技术属于数据中心故障预测
,具体涉及一种基于数据增强的数据中心故障预测方法。
技术介绍
近年来随着移动互联网的发展,互联网数据量呈现爆炸式增长,越来越多的互联网业务也都基于对大数据的分析。这些都导致了对计算资源的需求飞速提升。单机的计算能力已经不能满足需求。因此云计算应运而生。云计算是分布式计算、并行计算、虚拟化、负载均衡等传统计算机和网络技术发展融合的产物。云计算将大量的服务器通过虚拟机技术虚拟为一个个计算资源节点,用户无需关心硬件的实现和维护,只需要在云端购买计算资源,即可快速的获取自己所需的资源。而云计算的背后离不开数据中心的支撑。数据中心是由数万台服务器,数百台网络设备,以及冷却设备、供电设备等构成。而且设备数量随着云计算的发展仍在继续增长。随着这些平台的规模和复杂性的不断增长,数据中心系统的可靠性成为一个主要问题,因为系统的平均故障间隔时间(MTBF)随着系统组件数量的增加而减少。最近的研究结果表明,现有数据中心和云计算系统的可靠性受到10-100小时平均 ...
【技术保护点】
1.一种基于数据增强的数据中心故障预测方法,其特征在于,首先进行数据集预处理,将数据点归一化,得到故障预测模型的输入输出数据对,确定与故障相关的输入向量x构成真实故障数据集D
【技术特征摘要】
1.一种基于数据增强的数据中心故障预测方法,其特征在于,首先进行数据集预处理,将数据点归一化,得到故障预测模型的输入输出数据对,确定与故障相关的输入向量x构成真实故障数据集Dfault_real;然后建立数据增强模型,对真实故障数据集Dfault_real进行数据增强,生成器产生样本,用生成样本和真实样本更新判别器,判别器如果能分辨生成样本和真实样本,则固定判别器,更新生成器重新产生样本,如不能够分辨生成样本和真实样本,则进行数据合并,生成数据增强后的数据集Dfull;最后使用数据集Dfull训练故障预测模型至模型损失无法下降,按数据集Dfull的数据格式要求将当前时间点的数据输入模型,输出就是预测视野后的时间点发生故障的概率,实现故障预测。
2.根据权利要求1所述的基于数据增强的数据中心故障预测方法,其特征在于,数据集预处理中,假设预测视野为t1,使用时间点t以及之前的R-1个数据作为预测依据,L(t)为t时间点的数据点,故障预测模型的输入输出数据对为:
xT=(L(T-R+1),L(T-R+2),......,L(T))
yT=B(T+t1)
其中,T为某个时间点,B(t)为二值函数,所有的输入输出数据对构成真实数据集将y=1的输入输出数据对取出,输入向量x构成了构成真实故障数据集Dfault_real,输入向量记作xreal。
3.根据权利要求2所述的基于数据增强的数据中心故障预测方法,其特征在于,二值函数B(t)为:
4.根据权利要求1所述的基于数据增强的数据中心故障预测方法,其特征在于,数据增强模型包括生成器和判别器,对真实故障数据集进行数据增强中,生成器的输入从高斯混合模型中进行采样,具体为:
首先根据Dfault_real建立高斯混合模型,采取EM算法确定高斯混合模型的参数,得到一个高斯混合模型PG(z);
然后从PG(z)中采样得到z作为生成器的输入,生成器的输出是与x同维的向量,记作G(z),作为生成故障样本;
输出的样本构成生成故障数据集Dfault_generated,Dfault_generated和Dfault_real共同构成判别器的输入数据集;如果输入的是Dfault_generated中的数据,判...
【专利技术属性】
技术研发人员:伍卫国,康益菲,崔舜,杨傲,王倩,孙岚子,
申请(专利权)人:西安交通大学,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。