分布式系统的故障处理方法及相关设备技术方案

技术编号:39660875 阅读:11 留言:0更新日期:2023-12-11 18:23
本申请提出一种分布式系统的故障处理方法及相关设备

【技术实现步骤摘要】
分布式系统的故障处理方法及相关设备


[0001]本申请涉及计算机
,尤其涉及一种分布式系统的故障处理方法及相关设备


技术介绍

[0002]分布式系统是由多个独立计算机节点组成的计算机系统,计算机节点通过网络相互连接,共同协作完成某种任务或提供某种服务

在诸如
KV
存储系统等的分布式系统中,可以提供对象存储系统数据服务

然而,在系统中多个节点出现故障的情况下,会使得分布式系统中存储系统的服务不可用,降低分布式系统的可靠性


技术实现思路

[0003]本申请实施例提供一种分布式系统的故障处理方法及相关设备,以解决相关技术存在的问题,技术方案如下:
[0004]第一方面,本申请实施例提供了一种分布式系统的故障处理方法,用于分布式系统中,所述分布式系统包括代理服务节点和与所述代理服务节点通信连接的多个节点组,每个节点组中包括多个节点,同一节点组中的多个节点存储相同数据,每个节点组对应关联一个伴生服务节点;所述方法包括:
[0005]通过代理服务节点接收客户端的写请求,所述写请求携带有存储表信息;
[0006]根据所述存储表信息,通过代理服务节点从多个节点组中目标节点组,目标节点组关联目标伴生服务节点;
[0007]在目标节点组发生故障的情况下,开启请求所述目标伴生服务节点的伴生服务;
[0008]响应于针对所述目标节点组的写请求,将待写入数据存储到所述目标伴生服务节点中
r/>[0009]第二方面,本申请实施例提供了一种分布式系统的故障处理装置,用于分布式系统中,所述分布式系统包括代理服务节点和与所述代理服务节点通信连接的多个节点组,每个节点组中包括多个节点,同一节点组中的多个节点存储相同数据,每个节点组对应关联一个伴生服务节点;所述装置包括:
[0010]接收模块,用于通过代理服务节点接收客户端的写请求,所述写请求携带有存储表信息;
[0011]选择模块,用于根据所述存储表信息,通过代理服务节点从多个节点组中目标节点组,目标节点组关联目标伴生服务节点;
[0012]开启模块,用于在目标节点组发生故障的情况下,开启请求所述目标伴生服务节点的伴生服务;
[0013]存储模块,用于响应于针对所述目标节点组的写请求,将待写入数据存储到所述目标伴生服务节点中

[0014]第三方面,本申请实施例提供了一种电子设备,该电子设备包括:至少一个处理
器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,以使至少一个处理器能够执行上述分布式系统的故障处理方法

[0015]第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储计算机指令,当计算机指令在计算机上运行时,上述各方面任一种实施方式中的方法被执行

[0016]上述技术方案中的优点或有益效果至少包括:
[0017]在分布式系统中,为目标节点组配置目标伴生服务节点

在目标节点组发生故障的情况下,可以请求该目标伴生服务节点的伴生服务,从而在接收到针对该目标节点组的写请求,可以将待写入数据写入到目标伴生服务节点中

可知,在目标节点组出现故障的情况下,分布式系统可以通过伴生服务节点处理增量的写请求,缓解写请求无法写入的情况,提高分布式系统对写请求的处理效率,从而保障分布式系统的可靠性

[0018]上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制

除上述描述的示意性的方面

实施方式和特征之外,通过参考附图和以下的详细描述,本申请进一步的方面

实施方式和特征将会是容易明白的

附图说明
[0019]在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素

这些附图不一定是按照比例绘制的

应该理解,这些附图仅描绘了根据本申请公开的一些实施方式,而不应将其视为是对本申请范围的限制

[0020]图1示出根据本申请一实施例的分布式系统的故障处理方法的系统架构图

[0021]图2示出根据本申请一实施例的分布式系统的故障处理方法的流程示意图

[0022]图3示出根据本申请一实施例的分布式系统的故障处理方法的另一流程示意图

[0023]图4示意性示出了图3中步骤
S300
的子步骤流程图;
[0024]图5示意性示出了图4中步骤
S402
的子步骤流程图;
[0025]图6示出根据本申请一实施例的分布式系统的故障处理方法的另一流程示意图

[0026]图7示出根据本申请一实施例的分布式系统的故障处理方法的另一流程示意图

[0027]图8示意性示出了图7中步骤
S700
的子步骤流程图;
[0028]图9示意性示出了图7中步骤
S700
的子步骤流程图;
[0029]图
10
示意性示出了图7中步骤
S700
的子步骤流程图;
[0030]图
11
示出根据本申请一实施例的分布式系统的故障处理方法的另一流程示意图

[0031]图
12
示出根据本申请一实施例的分布式系统的故障处理方法的另一流程示意图

[0032]图
13
示出根据本申请一实施例的分布式系统的故障处理方法的另一流程示意图

[0033]图
14
示出根据本申请一实施例的分布式系统的故障处理方法的另一流程示意图

[0034]图
15
示出根据本申请一实施例的分布式系统的故障处理方法的另一流程示意图

[0035]图
16
示出根据本申请另一实施例的分布式系统的故障处理装置的示意性结构框图

[0036]图
17
是用来实现本申请实施例的分布式系统的故障处理方法的电子设备的框图

具体实施方式
[0037]在下文中,仅简单地描述了某些示例性实施例

正如本领域技术人员可认识到的那样,在不脱离本申请的精神或范围的情况下,可通过各种不同方式修改所描述的实施例

因此,附图和描述被认为本质上是示例性的而非限制性的

[0038]Raft
是一种共识算法
(
分布式一致性算法
)。
共识算法可以应用于分布式领域,通过
Raft
共识算法,可以让分布式集群中的各本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种分布式系统的故障处理方法,其特征在于,用于分布式系统中,所述分布式系统包括代理服务节点和与所述代理服务节点通信连接的多个节点组,每个节点组中包括多个节点,同一节点组中的多个节点存储相同数据,每个节点组对应关联一个伴生服务节点;所述方法包括:通过代理服务节点接收客户端的写请求,所述写请求携带有存储表信息;根据所述存储表信息,通过代理服务节点从多个节点组中目标节点组,目标节点组关联目标伴生服务节点;在目标节点组发生故障的情况下,开启请求所述目标伴生服务节点的伴生服务;响应于针对所述目标节点组的写请求,将待写入数据存储到所述目标伴生服务节点中
。2.
根据权利要求1所述的方法,其特征在于,还包括:在目标节点组发生故障且伴生服务请求已开启的情况下,响应于针对所述目标节点组的读请求,从所述目标伴生服务节点或所述目标节点组中读取并返回目标响应数据
。3.
根据权利要求1所述的方法,其特征在于,所述从所述目标伴生服务节点或所述目标节点组中读取并返回目标响应数据,包括:优先从所述目标伴生服务节点中读取并返回目标响应数据;在从所述目标伴生服务节点中读取失败的情况下,从所述目标节点组中读取并返回目标响应数据
。4.
根据权利要求3所述的方法,其特征在于,在从所述目标伴生服务节点中读取失败的情况下,从所述目标节点组中读取并返回目标响应数据,包括:确定所述目标节点组中当前存活的一个或多个节点;从所述一个或多个节点中选择一个目标节点;从所述目标节点中读取并返回目标响应数据
。5.
根据权利要求1至4任意一项所述的方法,其特征在于,还包括:在目标节点组故障已恢复的情况下,设置所述目标伴生服务节点的伴生服务为同步中;在所述目标节点组故障已修复且所述目标伴生服务节点的伴生服务处于同步中的情况下,响应于针对所述目标节点组的写请求,将待写入数据存储到所述目标节点组中
。6.
根据权利要求5所述的方法,其特征在于,还包括:在所述目标节点组故障已修复且所述目标伴生服务节点的伴生服务处于同步中的情况下,响应于针对所述目标节点组的读请求,从所述目标伴生服务节点和所述目标节点组中读取并返回目标响应数据
。7.
根据权利要求6所述的方法,其特征在于,在所述目标节点组故障已修复且所述目标伴生服务节点的伴生服务处于同步中的情况下,响应于针对所述目标节点组的读请求,从所述目标伴生服务节点和所述目标节点组中读取并返回目标响应数据,包括:从所述目标伴生服务节点中读取第一响应数据;从所述目标节点组中读取第二响应数据;在第一响应数据和第二响应数据均读取成功的情况下,根据第一响应数据的版本和第二响应数据的版本,将版本最新的响应数据作为目标响应数据

8.
根据权利要求7所述的方法,其特征在于,还包括:在第一响应数据的版本高于第二响应数据的版本的情况下,异步将所述第一响应数据写入到所述目标节点组中
。9.
根据权利要求7所述的方法,其特征在于,在所述目标节点组故障已修复且所述目标伴生服务节点的伴生服务处于同步中的情况下,响应于针对所述目标节点组的读请求,从所述目标伴生服务节点和所述目标节点组中读取并返回响应数据,还包括:在第一响...

【专利技术属性】
技术研发人员:刘易
申请(专利权)人:上海哔哩哔哩科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1