【技术实现步骤摘要】
一种分布式集群故障测试方法及装置
本专利技术涉及故障测试领域,具体涉及一种分布式集群故障测试方法及装置。
技术介绍
当前,不管是私有云还是公有云,计算节点的规模越来越大,500甚至1000以上的计算集群越来越多,因此,对系统整体的健壮性、高可用性要求越来越高,为了提升产品的竞争力,势必要有足够的保障,最大限度的降低产品故障的可能性,因此,需要及时对节点进行故障测试,以及时发现问题。但现有的故障测试仅支持各个节点单独进行故障测试,不支持集群部署,无法自动完成集群的故障测试,导致分布式集群的测试过程费时费力,测试效率低。
技术实现思路
为解决上述问题,本专利技术提供一种分布式集群故障测试方法及装置,分布式集群各节点之间相互联系,自动完成集群内多个节点的故障测试,提高测试效率。本专利技术的技术方案是:一种分布式集群故障测试方法,包括以下步骤:各节点实时同步故障测试配置文件;故障测试配置文件内记录各节点的测试顺序因子、测试故障类型;各节点基于测试顺序因子依据测试顺序规则,依次基于对应测试故 ...
【技术保护点】
1.一种分布式集群故障测试方法,其特征在于,包括以下步骤:/n各节点实时同步故障测试配置文件;故障测试配置文件内记录各节点的测试顺序因子、测试故障类型;/n各节点基于测试顺序因子依据测试顺序规则,依次基于对应测试故障类型进行故障测试。/n
【技术特征摘要】
1.一种分布式集群故障测试方法,其特征在于,包括以下步骤:
各节点实时同步故障测试配置文件;故障测试配置文件内记录各节点的测试顺序因子、测试故障类型;
各节点基于测试顺序因子依据测试顺序规则,依次基于对应测试故障类型进行故障测试。
2.根据权利要求1所述的分布式集群故障测试方法,其特征在于,所述测试顺序因子为测试权重;测试顺序规则为依据各节点的测试权重进行测试优先级排序,测试权重越高,测试优先级越高;
其中,测试权重的影响因素包括节点启动时间和故障解除成功次数;节点启动时间越长,测试权重越大;故障解除成功一次,测试权重相应降低,否则测试权重升高。
3.根据权利要求2所述的分布式集群故障测试方法,其特征在于,故障配置测试文件内还记录节点当前的故障状态;
某节点的故障发生后,该节点修改故障测试配置文件内该节点的故障状态为“故障”;该节点的故障解除后,该节点修改故障测试配置文件内该节点的故障状态为“正常”。
4.根据权利要求3所述的分布式集群故障测试方法,其特征在于,
各节点实时同步故障测试配置文件具体为:各节点根据故障测试进程和结果对故障测试配置文件修改后,实时将最新的故障测试配置文件同步到所有节点;
各节点基于测试顺序因子依据测试顺序规则,依次基于对应测试故障类型进行故障测试,具体为:各节点接收到最新的故障测试配置文件时,基于测试权重进行测试优先级排序,优先级最高的节点基于对应测试故障类型进行故障测试。
5.根据权利要求4所述的分布式集群故障测试方法,其特征在于,故障状态为“正常”的节点参与测试优先级排序。
6.根据权利要...
【专利技术属性】
技术研发人员:张震,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。