【技术实现步骤摘要】
云仿真系统中的容错方法
本专利技术涉及计算机
,具体涉及一种云仿真系统中的容错方法。
技术介绍
随着分布式仿真系统中成员的增加、运行时间的推进以及仿真规模的扩大,仿真系统的可靠性逐渐下降,故障概率逐渐升高。如果某个关键仿真节点出现故障,或者由于网络延时导致数据传输的堵塞或者数据传输丢包,可能会导致整个仿真系统的崩溃。若当前系统不具备一定容错能力,则唯一的方法就是重启整个仿真系统,可能引发严重后果,导致仿真进程无法正常推进。因此,在分布式仿真系统中,提高仿真系统的容错性,是分布式仿真系统必须解决的关键问题。
技术实现思路
鉴于上述技术问题,为了克服上述现有技术的不足,本专利技术提出了一种云仿真系统中的容错方法。本专利技术提供一种云仿真系统中的容错方法,包括以下步骤:S10:发现系统出现故障;S20:判断所述故障是否为仿真软件故障,若是,则采用快照容错模式进行容错,回滚至上一正常运行位置,若否,则执行步骤S30;S30:判断所述故障是否为仿真节点故障,若是,则采用备份容错模式进行容错,选择一备份 ...
【技术保护点】
1.一种云仿真系统中的容错方法,其特征在于,包括以下步骤:/nS10:发现系统出现故障;/nS20:判断所述故障是否为仿真软件故障,若是,则采用快照容错模式进行容错,回滚至上一正常运行位置,若否,则执行步骤S30;/nS30:判断所述故障是否为仿真节点故障,若是,则采用备份容错模式进行容错,选择一备份节点作为新的仿真节点运行,若否,则执行步骤S40;/nS40:判定所述故障为仿真服务器故障,采用虚拟机迁移容错模式进行容错。/n
【技术特征摘要】
1.一种云仿真系统中的容错方法,其特征在于,包括以下步骤:
S10:发现系统出现故障;
S20:判断所述故障是否为仿真软件故障,若是,则采用快照容错模式进行容错,回滚至上一正常运行位置,若否,则执行步骤S30;
S30:判断所述故障是否为仿真节点故障,若是,则采用备份容错模式进行容错,选择一备份节点作为新的仿真节点运行,若否,则执行步骤S40;
S40:判定所述故障为仿真服务器故障,采用虚拟机迁移容错模式进行容错。
2.根据权利要求1所述的容错方法,其特征在于,步骤S20还包括:若采用快照容错模式进行容错仍然不能排除故障,则采用所述备份容错模式进行容错,选择一备份节点作为新的仿真节点运行。
3.根据权利要求1所述的容错方法,其特征在于,步骤S40还包括:若采用虚拟机迁移容错模式进行容错仍然不能排除故障,则采用所述备份容错模式进行容错,选择一备份节点作为新的仿真节点运行。
4.根据权利要求1-3任一项所述的容错方法,其特征在于,所述采用快照容错模式进行容错包括设置快照容错周期Tp,快照容错周期Tp与资源消耗率和消耗时间呈正比。
5.根据权利要求4所述的容错方法,其特征在于,所述快照容错周期ΔT为快照的消耗时间,r为快照所需软硬件资源,R为软硬件资源上限,L为仿真节点仿真任务等级,L取值为1,2,3,4或5,K为调节参数,Tf为故障平均时间间隔。
6.根据权利要求1-3任一项所述的容错方法,其特征在于,所述采用备份容错模式进行容错包括:
S301:在系统运行过程中,为至少一个仿真节点设置多个对应的备份节点;
S302:所述仿真节点向每个所述备份节点发送心跳信息和当前仿真数据,同时每个所述备份节点向所述仿真节点发送心跳信息;
S303:若在某个心跳周期内,所述仿真节点对应的所有备份节点中占数量1/2以上的备份节点均未收到所述仿真节点的心跳信息,则判定所述仿真节点出现故障;否则,判定所述仿真节点工作正常;
S304:若等待了M个心跳周期,所述仿真节点仍然未收到任何一个对应的备份节点的心跳信息,则判定所述对应的备份节点已失效,删除所述对应的备份节点,并为该仿真节点重新纳入至少一个备份节点,M为正整数,且M≥20;
S305:当所述仿真节点出现故障后,采用选举方式在所述仿真节点对应的所有备份节点中选择一个备份节点作为新的仿真节点;
S306:所述新的仿真节点与其他仿真节点继续进行信息交互,并且为所述新的仿真节点设置至少一个对应的备份节点。
7.根据权利要求6所述的容错方法,其特征在于,所述备份容错模式的备份节点创建位置的选择方法包括:
S100:计算多...
【专利技术属性】
技术研发人员:陈志佳,孟宪国,冯少冲,邸彦强,朱元昌,
申请(专利权)人:中国人民解放军陆军工程大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。