IaaS云系统中物理机的主动更新方法、装置及服务器制造方法及图纸

技术编号:10264870 阅读:88 留言:0更新日期:2014-07-30 12:07
本发明专利技术公开了一种IaaS云系统中物理机的主动更新方法、装置及服务器,其中的主动更新方法包括以下步骤:获取IaaS云系统中每台物理机的历史故障数据;逐台对获取的历史故障数据进行分析处理,获得每台物理机历史故障数据的分布规律,并基于所得分布规律预测相应物理机的下次故障数据;依据预测结果对相应物理机执行更新操作,本发明专利技术的IaaS云系统中物理机的主动更新方法通过对每台物理机的历史故障数据进行分析、建模,获得物理机故障的发生规律并依据所获得的规律对下次故障发生点进行预测,动态的调整物理机的更新时机,与现有技术中设定固定更新时间或仅依据历史故障数据平均值的方法相比,可以更好的兼顾更新系统开销和云系统可靠性。

【技术实现步骤摘要】
IaaS云系统中物理机的主动更新方法、装置及服务器
本专利技术属于云计算
,涉及云计算运行中的资源实施调度和优化控制技术,具体涉及一种IaaS云系统中物理机(PhysicalMachine,PM)的主动更新方法、装置及服务器。
技术介绍
云计算是指将计算分布在大量的分布式计算机上,使用云计算平台、通过网络为用户提供信息服务的计算模式。相对于传统的软件形态,云计算具有松散耦合、随需应变、成本可控、资源虚拟、异构协同等显著的优势,使其更适应现今的电子商务、柔性制造、移动互联网等应用。云计算包含两个方面的含义:一个方面是底层构建的云计算平台基础设施,是用来构建上层应用程序的基础;另一方面的含义是构建在这个基础平台之上的云计算应用程序。云计算按照服务类型可分为三类:将基础设施作为服务(InfrastructureasaService,IaaS)、将平台作为服务(PlatformasaService,PaaS)和将软件作为服务(SoftwareasaService,SaaS)。IaaS模式云计算平台是通过系统虚拟化、多处理器虚拟化、内存虚拟化、I/O虚拟化等虚拟化技术将物理资源虚拟化成资源池,这些资源再由云计算平台进行统一的管理调度。目前,有很多企业和科研机构推出了IaaS云计算平台,面向用户提供计算资源和存储资源。最具有代表性的是亚马逊(Amazon)的弹性计算云(ElasticComputeCloud,EC2)。同其他软硬件系统中的模块一样,IaaS云中的主要计算资源,物理机在运行时也受到硬件故障和软件故障的制约。当PM出现上述故障和故障时,其上运行的应用和程序(主要以虚拟机(VisualMachine,VM)实例的形式存在)也随之故障。当系统监测到故障后,开始对故障的PM和其上的VM进行修复,具体而言,先将故障的VM的最近存档点(checkpoint)映像(image)提取出来并转移到系统的后备存储或后备PM上,然后对PM进行恢复(硬重启或软重启),最后将提取出的VM映像重新加载到已恢复的PM上并执行启动。上述这种事后修复的措施,存在一定的不足:从PM故障到故障被系统检测到还有一段时间的延迟,因此可能出现“系统向已经故障的PM继续派遣任务”的错误;故障时VM的状态与最近存档点的保存的VM映像所代表的状态有所区别,因此PM修复后实际上是将所涉及的VM还原到故障前某时刻而非故障时的状态,这实际上导致了无用功;故障后修复的系统开销较大,对IaaS云系统的性能的负面影响较大。为了避免上述问题,IaaS云系统多采用“故障后修复”与“主动更新(rejuevenation)”相结合的策略。主动更新是指,在PM还未出现故障时,就主动停止其运行并将其上的VM状态保存,待PM重启完成时,重新加载保存的VM状态并继续执行。相对于故障后修复,主动更新的优势在于:更新通常只是进行重启工作,故其系统开销远小于修复;由于更新重启后恢复的是更新前最后一刻的VM状态,因此VM执行进度不受影响,不存在无用功。然而,如何确定PM主动更新的时机,却是一个技术难点。如果主动更新间隔时间过短,更新过于频繁,PM故障出现的可能性降低,然而更新带来的系统开销将抵消PM故障率降低产生的系统性能提升;如果更新间隔时间过大,更新过于稀疏,则PM故障先于更新出现的概率增大,系统不得不以事后修复作为主要的维护措施,带来可靠性和性能的损失,失去了主动更新的意义。在此背景下,如何动态的根据IaaS云的运行时状态来尽心更新时机的决策,从而实现系统开销和性能的双赢,变成为了研究的热点和难点。云计算本身属于一个新兴
,相关的技术、理论和方法还处于成长期,现有的IaaS云系统的PM更新技术,存在诸多不足:(1)多采用固定周期PM更新的手段。现有的IaaS系统多预先设定一个固定的间隔时间进行周期性的更新。然而,由于系统负载、可靠性的动态可变性,固定间隔时间的更新往往难以兼顾更新操作开销少和系统可靠性高的要求;(2)缺乏量化趋势预测的机制。现有的IaaS云维护技术,没有充分的对系统历史故障数据进行分析和建模,而多是机械的采用历史平均或最近历史故障数据作为依据进行控制决策;(3)没有考虑不同PM的差别。现有的技术将IaaS云系统中的各个PM一视同仁,采取同样的控制策略和控制时间间隔,而没有考虑不同PM在负载、执行效率、可靠性上的差异。
技术实现思路
本专利技术的目的在于克服现有技术中的上述问题,提供一种能够兼顾更新开销、云系统可靠性和PM差异性的IaaS云系统中物理机的主动更新方法、装置及服务器。为解决上述技术问题,本专利技术采用以下技术方案:一种IaaS云系统中物理机的主动更新方法,包括以下步骤:获取IaaS云系统中每台PM的历史故障数据;逐台对获取的历史故障数据进行处理,获得每台PM历史故障数据的分布规律,并基于所得分布规律预测相应PM的下次故障数据;依据预测结果对相应PM执行更新操作。进一步的技术方案是,上述IaaS云系统中物理机的主动更新方法贯穿整个IaaS云系统运行过程。进一步的技术方案是分别对获取的每台PM的历史故障数据进行平滑处理,并区分每台PM历史故障数据中的平滑点和非平滑点。进一步地,上述的平滑处理可以采用最小二乘法、傅里叶变换或其他具有相同技术效果的方法。进一步地,上述的平滑处理可以采用以下方法:对于第j台PM的第i个历史故障数据gzi,j,首先,计算该历史故障数据的曲度余弦值yxi,j:其中,gzi-1,j为gzi,j的前一点,gzi+1,j为gzi,j的后一点,yxi,j表示了以相邻三个历史故障数gzi-1,j、gzi,j、gzi+1,j进行三角函数匹配的对应的凹凸度,其值表示了三点间的平滑程度,值越大表示越平滑,反之则越突出;然后,计算第j台PM的历史故障数据的平均曲度PJQDj:PJQDj=mean{yxi,j|0<i≤DQL}其中,DQL为测得的历史故障数据的个数;最后,为测得的每个历史故障数据设一个标记变量IFTi,j:其中,β为经验系数,0<β<0.5,一般取为0.1;IFTi,j=1表示对应的历史故障数据为平滑点,反之为非平滑点。进一步地,基于上述平滑处理结果,求历史故障数据中平滑点的平均斜率及非平滑点的平均影响力,由所得平滑点的平均斜率和非平滑点的平均影响力共同预测下一个故障数据。进一步地,上述的非平滑点的平均影响力YXL可以定义如下:其中,α表示衰减因子,0<α<1,其直观作用是作为一种权重,使距离目前越远的非平滑点的影响力越小,而较近的非平滑点的影响力较大;进一步地,所述IaaS云系统中PM的历史故障数据可以为故障间隔时间。进一步地,所述PM历史故障间隔时间样本yb的获取包括以下步骤:设定一个时间间隔jg;统计第i轮时间间隔jg内第j台PM的故障次数csi,j;第i轮时间间隔jg内第j台PM的故障间隔时间ybi,j为:由式(1)可见,对于某一台PM来说,历史故障间隔时间样本yb的序数与检测的时间间隔jg的轮数一一对应,即i表示时间间隔的轮数,同时表示历史故障间隔时间样本的序数,0<i≤DQL,DQL为时间间隔的当前轮数,也表示历史故障间隔时间样本yb的个数;xsj为松驰系数,其计算式如下:其中,mean表本文档来自技高网
...
IaaS云系统中物理机的主动更新方法、装置及服务器

【技术保护点】
一种IaaS云系统中物理机的主动更新方法,其特征在于:包括以下步骤: 获取IaaS云系统中每台物理机的历史故障数据; 逐台对获取的历史故障数据进行处理,获得每台物理机历史故障数据的分布规律,并基于所得分布规律预测相应物理机的下次故障数据; 依据预测结果对相应物理机执行更新操作。

【技术特征摘要】
1.一种IaaS云系统中物理机的主动更新方法,其特征在于:包括以下步骤:获取IaaS云系统中每台物理机的历史故障数据;逐台对获取的历史故障数据进行处理,获得每台物理机历史故障数据的分布规律,并基于所得分布规律预测相应物理机的下次故障数据;依据预测结果对相应物理机执行更新操作;所述IaaS云系统中物理机的主动更新方法贯穿整个IaaS云系统运行过程;分别对获取的每台物理机的历史故障数据进行平滑处理,并区分每台物理机历史故障数据中的平滑点和非平滑点;所述平滑处理采用最小二乘法、傅里叶变换法或以下方法:对于第j台物理机的第i个历史故障数据gzi,j,首先,计算该历史故障数据的曲度余弦值yxi,j:其中,gzi-1,j为gzi,j的前一点,gzi+1,j为gzi,j的后一点,yxi,j表示了以相邻三个历史故障数gzi-1,j、gzi,j、gzi+1,j进行三角函数匹配的对应的凹凸度,其值表示了三点间的平滑程度,值越大表示越平滑,反之则越突出;然后,计算第i台物理机的历史故障数据的平均曲度PJQDj:PJQDj=mean{yxi,j|0<i≤DQL}其中,DQL为测得的历史故障数据的个数;最后,为测得的每个历史故障数据设一个标记变量IFTi,j:其中,β为经验系数,0<β<0.5;IFTi,j=1表示对应的历史故障数据为平滑点,反之为非平滑点;求历史故障数据中平滑点的平均斜率及非平滑点的平均影响力,由所得平滑点的平均斜率和非平滑点的平均影响力共同预测下一个故障数据;所述非平滑点的平均影响力YXL定义如下:其中,α表示衰减因子,0<α<1;DQL为测得的历史故障数据的个数,IFTi,j为设置的标记变量,IFTi,j=1表示对应的历史故障数据为平滑点,反之为非平滑点,gzi,j为第j台物理机的第i个历史故障数据,gzi-1,j为gzi,j的前一点。2.根据权利要求1所述的IaaS云系统中物理机...

【专利技术属性】
技术研发人员:闫明明
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1