电力云虚拟机负载预测方法技术

技术编号:20680234 阅读:23 留言:0更新日期:2019-03-27 18:39
本发明专利技术提供的一种电力云虚拟机负载预测方法,包括S1:对虚拟机资源运行的数据进行预处理;S2:采用主成分分析法将对经预处理后的数据进行降维,得到样本矩阵Z;S3:将样本矩阵Z中的元素训练BP神经网络,并利用遗传算法优化BP神经网络;得到BP神经网络的预测模型;S4:将所要预测数据所在日期的前3天的虚拟机资源运行的数据进行预处理后,输入预先建立的BP神经网络的预测模型,得到所要预测日期的数据值;本发明专利技术通过关联缺失和异常数据前后数据,对缺失和异常数据分别进行补充和更新的预处理,然后将所要预测时刻的数据的前若干天的实际数据经预处理后输入通过遗传算法优化的BP神经网络,得到预测数据,预测精度高,实用性更广。

【技术实现步骤摘要】
电力云虚拟机负载预测方法
本专利技术涉及云计算
,具体涉及一种电力云虚拟机负载预测方法。
技术介绍
云计算技术能够为用户提供动态的虚拟资源池,所以虚拟化以及虚拟资源调度是云计算不可或缺的技术。国内外研究者们对虚拟资源调度策略进行了较多的研究,主要研究方向有:以提高资源利用率为目标的虚拟资源调度的研究、以均衡物理机资源利用率为目标的虚拟资源调度的研究、以降低能耗为目标的虚拟资源调度的研究。电力云平台的虚拟资源池中有上百台虚拟机,各应用系统占有不同资源且在不同时间处于不断变化状态,针对各虚拟机使用情况,没有平台进行精确、长期的统计分析,运维人员无法准确掌握资源使用情况及需求趋势。现有技术都是对资源利用率设置阈值,在算法上进行优化,而不对历史数据或实时数据预处理。此外,电网云平台中虚拟资源可能处于不足或者剩余的状态,运维人员无法准确预测资源使用情况及需求趋势,造成资源浪费。因此,需要提出一种新的电力云虚拟机负载预测方法。
技术实现思路
有鉴于此,本专利技术的目的是提供一种电力云虚拟机负载预测方法,通过关联缺失和异常数据前后数据,对缺失和异常数据分别进行补充和更新的预处理,然后将所要预测时刻的数据的前若干天的实际数据经预处理后输入通过遗传算法优化的BP神经网络,得到所要预测时刻的预测数据,预测精度高,实用性更广。本专利技术提供一种电力云虚拟机负载预测方法,包括步骤:S1:对虚拟机资源运行的数据进行预处理;S2:采用主成分分析法将对经预处理后的数据进行降维,得到样本矩阵Z;S3:将样本矩阵Z中的元素训练BP神经网络,并利用遗传算法优化BP神经网络;得到BP神经网络的预测模型;S4:将所要预测数据所在日期的前3天的虚拟机资源运行的数据进行预处理后,输入预先建立的BP神经网络的预测模型,得到所要预测日期的数据值。进一步,所述步骤S1包括:S11:采集预设的连续时间段的虚拟机资源运行的数据;所述预设的连续时间段为4天;S12:判断采集的连续时间段的虚拟机资源运行的数据中是否存在异常数据或缺失数据,若存在,则进入步骤S13,若不存在,则进入步骤S3;S13:对异常数据或缺失数据进行预处理,更新连续时间段的虚拟机资源运行的数据;S14:判断更新后的连续时间段的虚拟机资源运行的数据是否存在异常数据,若存在,返回步骤S13,若不存在则进入步骤S3。进一步,所述步骤S12中判断采集的连续时间段的虚拟机资源运行的数据中是否存在异常数据和步骤S14中判断更新后的连续时间段的虚拟机资源运行的数据是否存在异常数据具体为:遍历当前连续时间段的虚拟机资源运行的数据,逐一判断(1-1)式是否成立,如成立,则存在异常数据,且t时刻虚拟机资源运行的数据为异常数据,若遍历当前连续时间段的虚拟机资源运行的数据,不存在数据使(1-1)式成立,则不存在异常数据;所述(1-1)式为:υ(t)>3σ(1-1)其中,υ(t)表示t时刻虚拟机资源运行的数据的剩余误差;σ表示当前连续时间段的虚拟机资源运行的数据的标准差;所述υ(t)的计算公式为:其中,表示采集的虚拟机资源运行的所有数据的算术平均值,x(t)表示t时刻虚拟机资源运行的数据值,υ(t)表示t时刻虚拟机资源运行的数据的剩余误差。进一步,所述步骤S13具体包括:若同一天中存在不连续的n个缺失数据或异常数据,则根据离散数据更新公式分别对这n个数据点值进行更新,所述离散数据更新公式为:其中,x1(t)表示更新后的t时刻虚拟机资源运行的数据值,在(2-1)式中t时刻的数据为缺失数据或异常数据;k表示t时刻的前k时刻和后k时刻;k≥1,m为中间变量;若同一天中存在连续的n个缺失数据或异常数据,则根据连续数据更新公式Ⅰ分别对这连续的n个数据点值进行更新,所述连续点数据更新公式Ⅰ为:其中,x1(t)表示更新后的t时刻虚拟机资源运行的数据值,t′表示当前t时刻的前一天的t时刻;x(t′)表示前一天t时刻的虚拟机资源运行的数据值;在(2-2)式中时刻t至时刻t+n的时间段的数据均为缺失数据或异常数据,k表示时刻t至时刻t+n的时间段的后k时刻和时刻t至时刻t-n的时间段的前k时刻;k≥1,m为中间变量;若连续存在N天的数据为缺失数据或异常数据,则根据连续数据更新公式Ⅱ分别对这连续的N天的各个数据点值进行更新,所述连续数据更新公式Ⅱ为:其中,x1(t)表示更新后的t时刻虚拟机资源运行的数据值,表示t时刻虚拟机资源运行的初始更新数据值,表示t+m时刻虚拟机资源运行的初始更新数据值,表示t-m时刻虚拟机资源运行的初始更新数据值,k表示t时刻的前k时刻和后k时刻,k≥1,m为中间变量;λ为校正常数;所述的计算公式为:其中,表示t时刻虚拟机资源运行的初始更新数据值,xG+N+M(t)表示当前天数G天的后N+M天的t时刻的数据值,xG-N-M(t)表示当前天数G天的前N+M天的t时刻的数据值,K表示G+N天的后M天和G-N天的前M天;K≥1,M为中间变量。进一步,所述步骤S2具体包括:S21:将预处理后的虚拟机资源运行的数据用L×4阶的矩阵X表示;Xij为矩阵X中第i行第j列的元素,表示第i个预处理后的虚拟机资源运行的数据的第j个信息;其中,L是矩阵X的列数,表示有L个预处理后的虚拟机资源运行的数据;4是矩阵X的列数,表示每个预处理后的虚拟机资源运行的数据依次有4类信息,具体地,Xi1表示第i个预处理后的虚拟机资源运行的数据的时刻信息,Xi2表示第i个预处理后的虚拟机资源运行的数据的CPU平均利用率信息,Xi3表示第i个预处理后的虚拟机资源运行的数据的网络带宽信息,Xi4表示第i个预处理后的虚拟机资源运行的数据的内存平均利用率信息,S22:对矩阵X中的元素进行标准化,得到标准化矩阵Y,其中矩阵Y中的元素Yij的标准化公式为:其中,表示矩阵X中第j列元素的算术平均值,Sj表示矩阵X中第j列元素的标准差;Yij表示矩阵Y中第i行第j列的元素;S23:计算标准化矩阵Y的相关矩阵R,所述R的计算公式为:其中,L表示标准化矩阵Y的行数,T为转置符号;S24:求解相关矩阵R的特征方程,得到特征矩阵λ和特征向量矩阵A,所述相关矩阵R的特征方程为:RA=Aλ(3-3)S25:确定特征矩阵λ中前q个特征根;所述q为满足前q个特征根累计贡献率不小于85%的最小值,所述特征矩阵λ的中第h个特征根λh的贡献率Ch计算公式为:其中,p表示特征矩阵λ中一共有p个特征根,λj为特征矩阵λ中第j个特征根;所述前q个主成分累计贡献率C的计算公式为:S26:根据特征向量矩阵A中与特征矩阵λ中前q个特征根λ1,λ2,……,λp对应的特征向量α1,α2,……,αq构建q×4阶的样本矩阵Z,所述Z中的元素的计算公式为:Zij=αiYij(3-6)其中,Zij为样本矩阵Z中第i行第j列的元素值,αi为特征向量矩阵A中与特征矩阵λ中前q个特征根λ1,λ2,……,λp对应位置的特征向量α1,α2,……,αq中第i个特征向量,Yij为标准化矩阵Y中第i行第j列的元素值。进一步,所述步骤S3中具体如下:S31:初始化BP神经网络,所述BP神经网络包括输入层、隐层和输出层;采用浮点数编码对个体进行编码,所述每个个体包括BP神经网络的所有权值和阈值;初始化BP神经网络的输入层本文档来自技高网...

【技术保护点】
1.一种电力云虚拟机负载预测方法,其特征在于:包括步骤:S1:对虚拟机资源运行的数据进行预处理;S2:采用主成分分析法将对经预处理后的数据进行降维,得到样本矩阵Z;S3:将样本矩阵Z中的元素训练BP神经网络,并利用遗传算法优化BP神经网络;得到BP神经网络的预测模型;S4:将所要预测数据所在日期的前3天的虚拟机资源运行的数据进行预处理后,输入预先建立的BP神经网络的预测模型,得到所要预测日期的数据值。

【技术特征摘要】
1.一种电力云虚拟机负载预测方法,其特征在于:包括步骤:S1:对虚拟机资源运行的数据进行预处理;S2:采用主成分分析法将对经预处理后的数据进行降维,得到样本矩阵Z;S3:将样本矩阵Z中的元素训练BP神经网络,并利用遗传算法优化BP神经网络;得到BP神经网络的预测模型;S4:将所要预测数据所在日期的前3天的虚拟机资源运行的数据进行预处理后,输入预先建立的BP神经网络的预测模型,得到所要预测日期的数据值。2.根据权利要求1所述电力云虚拟机负载预测方法,其特征在于:所述步骤S1包括:S11:采集预设的连续时间段的虚拟机资源运行的数据;所述预设的连续时间段为4天;S12:判断采集的连续时间段的虚拟机资源运行的数据中是否存在异常数据或缺失数据,若存在,则进入步骤S13,若不存在,则进入步骤S2;S13:对异常数据或缺失数据进行预处理,更新连续时间段的虚拟机资源运行的数据;S14:判断更新后的连续时间段的虚拟机资源运行的数据是否存在异常数据,若存在,返回步骤S13,若不存在则进入步骤S2。3.根据权利要求2所述电力云虚拟机负载预测方法,其特征在于:所述步骤S12中判断采集的连续时间段的虚拟机资源运行的数据中是否存在异常数据和步骤S14中判断更新后的连续时间段的虚拟机资源运行的数据是否存在异常数据具体为:遍历当前连续时间段的虚拟机资源运行的数据,逐一判断(1-1)式是否成立,如成立,则存在异常数据,且t时刻虚拟机资源运行的数据为异常数据,若遍历当前连续时间段的虚拟机资源运行的数据,不存在数据使(1-1)式成立,则不存在异常数据;所述(1-1)式为:υ(t)>3σ(1-1)其中,υ(t)表示t时刻虚拟机资源运行的数据的剩余误差;σ表示当前连续时间段的虚拟机资源运行的数据的标准差;所述υ(t)的计算公式为:其中,表示采集的虚拟机资源运行的所有数据的算术平均值,x(t)表示t时刻虚拟机资源运行的数据值,υ(t)表示t时刻虚拟机资源运行的数据的剩余误差。4.根据权利要求2所述电力云虚拟机负载预测方法,其特征在于:所述步骤S13具体包括:若同一天中存在不连续的n个缺失数据或异常数据,则根据离散数据更新公式分别对这n个数据点值进行更新,所述离散数据更新公式为:其中,x1(t)表示更新后的t时刻虚拟机资源运行的数据值,在(2-1)式中t时刻的数据为缺失数据或异常数据;k表示t时刻的前k时刻和后k时刻;k≥1,m为中间变量;若同一天中存在连续的n个缺失数据或异常数据,则根据连续数据更新公式Ⅰ分别对这连续的n个数据点值进行更新,所述连续点数据更新公式Ⅰ为:其中,x1(t)表示更新后的t时刻虚拟机资源运行的数据值,t′表示当前t时刻的前一天的t时刻;x(t′)表示前一天t时刻的虚拟机资源运行的数据值;在(2-2)式中时刻t至时刻t+n的时间段的数据均为缺失数据或异常数据,k表示时刻t至时刻t+n的时间段的后k时刻和时刻t至时刻t-n的时间段的前k时刻;k≥1,m为中间变量;若连续存在N天的数据为缺失数据或异常数据,则根据连续数据更新公式Ⅱ分别对这连续的N天的各个数据点值进行更新,所述连续数据更新公式Ⅱ为:其中,x1(t)表示更新后的t时刻虚拟机资源运行的数据值,表示t时刻虚拟机资源运行的初始更新数据值,表示t+m时刻虚拟机资源运行的初始更新数据值,表示t-m时刻虚拟机资源运行的初始更新数据值,k表示t时刻的前k时刻和后k时刻,k≥1,m为中间变量;λ为校正常数;所述的计算公式为:其中,表示t时刻虚拟机资源运行的初始更新数据值,xG+N+M(t)表示当前天数G天的后N+M天的t时刻的数据值,xG-N-M(t)表示当前天数G天的前N+M天的t时刻的数据值,K表示G+N天的后K天和G-N天的前K天;K≥1,M为中间变量。5.根据权利要求1所述电力云虚拟机负载预测方法,其特征在于:所述步骤S2具体包括:S21:将预处理后的虚拟机资源运行的数据用L×4阶的矩阵X表示;Xij为矩阵X中第i行第j列的元素,表示第i个预处理后的虚拟机资源运行的数据的第j个信息;其中,L是矩阵X的列数,表示有L个预处理后的虚拟机资源运行的数据;4是矩阵X的列数,表示每个预处理后的虚拟机资源运行的数据依次有4类信息,具体地,Xi1表示第i个预处理后的虚拟机资源运行的数据的时刻信息,Xi2表示第i个预处理后的虚拟机资源运行的数据的CPU平均利用率信息,Xi3表示第i个预处理后的虚拟机资源运行的数据的网络带宽信息,Xi4表示...

【专利技术属性】
技术研发人员:徐郁詹然智谭刚陈露伍冲翀郝海泉陈聿
申请(专利权)人:国家电网有限公司国网重庆市电力公司信息通信分公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1