【技术实现步骤摘要】
一种云计算中基于人工势场的增量检查点容错方法
本专利技术属于云计算领域,尤其涉及一种基于人工势场的增量检查点容错方法。
技术介绍
随着大数据时代的到来,数据的处理能力已经愈发成为用户的关注焦点。相较于传统的集群技术,云计算的按需提供服务,可靠弹性服务引起了全世界的瞩目。虽然云计算有很多的优点,是迎合网络时代发展孕育出来的技术,但是由于构建云计算平台的基础组件的多样性、任务调度异常等种种原因,云计算总是出现种种故障,这是无法避免的。这些故障通常会导致提交的任务无法按照预期进行交付,甚至可能造成用户的经济损失,这是用户无法容忍的。由于动态服务架构以及基础设备的复杂特性,容错成为云计算中不可忽视的问题。基于云计算的可靠弹性服务特性,云计算得到广泛关注,但是故障的处理能力并没有得到妥善的解决。优质的服务提供策略是云计算领域研究的主要课题。检查点技术是云计算中最常用的容错技术,常常作为云计算中的容错资源调度的依据,然而现阶段研究内容中冗余资源的布局是静态且有预设条件的,如果任务执行过程中的内存占用量发生变化或者网络可达性变化, ...
【技术保护点】
1.一种云计算中基于人工势场的增量检查点容错方法,其特征在于,包括以下步骤:/nS1.根据不同故障概率将检查点类型设置为存储在远程节点的全局检查点、存储在本地设备全局检查单和存储在内存的增量检查点三类检查点;/nS2.构建检查点的开销模型,以最小化预期检查点开销为目标,计算各类型检查点频率函数;/nS3.通过建立不同影响因素下的引力势场、斥力势场以及总势场叠加模型,把检验点布局定位问题转化为在人工势场中搜索势能极值位置问题;/nS4.采用栅格模型对布局检验点的环境信息进行描述,得到布局检验点的状态数字势场模型;/nS5.运用连续蚁群优化算法进行求解得到最优的检查点布局结果, ...
【技术特征摘要】
1.一种云计算中基于人工势场的增量检查点容错方法,其特征在于,包括以下步骤:
S1.根据不同故障概率将检查点类型设置为存储在远程节点的全局检查点、存储在本地设备全局检查单和存储在内存的增量检查点三类检查点;
S2.构建检查点的开销模型,以最小化预期检查点开销为目标,计算各类型检查点频率函数;
S3.通过建立不同影响因素下的引力势场、斥力势场以及总势场叠加模型,把检验点布局定位问题转化为在人工势场中搜索势能极值位置问题;
S4.采用栅格模型对布局检验点的环境信息进行描述,得到布局检验点的状态数字势场模型;
S5.运用连续蚁群优化算法进行求解得到最优的检查点布局结果,其中检查点文件数据上传模块和验证模块中使用了非对称加密中的哈希算法和数字签名算法,运用区块链技术思想确保检查点文件安全性。
2.根据权利要求1所述的一种云计算中基于人工势场的增量检查点容错方法,其特征在于,所述步骤S1根据不同故障概率将检查点类型设置为三种类型的检查点,存储在远程节点的全局检查点、存储在本地设备全局检查单和存储在内存的增量检查点三类检查点,分别表示为N-checkpoint,m-checkpoint和i-checkpoint,参数pn是从N型检查点恢复的概率,并且是设置i-checkpoint和m-checkpoint的开销的比率,u的范围是(0,1),当u=0时,表示i-checkpoint的开销Oi为0;当u=1时,表示i-checkpoint的开销Oi等于m-checkpoint的开销Om;在这两种情况下,两级增量检查点恢复方案将退化为两级检查点恢复方案并不符合实际情况,pn的范围是(0,1);情况,pn=0=或pn=1,表示系统中只发生永久性故障或仅发生瞬时故障,与实际情况不符,因此也不考虑这两种情况。
3.根据权利要求2所述的一种云计算中基于人工势场的增量检查点容错方法,其特征在于,所述步骤S2构建检查点的开销模型,以最小化预期检查点开销为目标,计算各类型检查点频率函数,具体包括:设定检查点总开销Ttotal=Tcheckpoint+Trecovery+Trecompute,其中Tcheckpoint为设置检查点的总开销,Trecovery为发生故障时从故障恢复计算时间开销,Trecomput为重新计算的时间开销,假设N-checkpoint,m-checkpoint和i-checkpoint检查点的数量分别是n、m和i,开销分别为为Om、On和Oi,为确定获得检查点布局策略,设定检查点频率函数其中ti(i=1,2,...)是第i个检查点得位置,最终以最小化Ttotal为目的,得到检查点频率函数。
4.根据权利要求3所述的一种云计算中基于人工势场的增量检查点容错方法,其特征在于,通过最小化全局平均检查点开销的最佳检查点频率函数可表示为
假设N-checkpoint,m-checkpoint和i-checkpoint检查点的数量分别是n、m和i,开销分别为为Om、On和Oi,f(t)表示故障概率函数。
5.根据权利要求3所述的一种云计算中基于人工势场的增量检查点容错方法,其特征在于,所述步骤S3中,人工势能场函数模型设计如下:
S31.针对云计算节高可用性,定义引力系数,其中ξ表示目标节点对其他其他节点的引力的权力系数,若目标节点无N-checkpoint,则ξ=1,当目标节点存储过N-checkpoint,则ξ=(0.8)n其中n表示节点存储的数量;
S32定义为目标节点的资源使用相关加权函数其中qcpu、qmem、qram分别表示目标节点的cpu使用百分比、...
【专利技术属性】
技术研发人员:何利,袁征,杨迪,吴伟,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:重庆;50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。