System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 分布式数据库中节点故障检测与解决制造技术_技高网
当前位置: 首页 > 专利查询>诺宝公司专利>正文

分布式数据库中节点故障检测与解决制造技术

技术编号:41123529 阅读:4 留言:0更新日期:2024-04-30 17:50
本发明专利技术涉及分布式数据库中节点故障检测与解决,描述了用于检测和解决分布式数据库系统中的故障的方法和系统。分布式数据库系统中的第一节点可以检测与分布式数据库系统中的至少一个其他节点的通信中断。这指示网络故障。响应于检测到该故障,第一节点开始故障解决协议。这调用邻居节点之间的相应可疑节点列表的协调广播。每个节点将其自己的可疑节点列表与其邻居的可疑节点列表进行比较,以确定哪些节点仍直接相互连接。每个节点确定这些直接连接的节点的最大组以及其是否在该组中。如果节点不在该组中,则使其自己发生故障以解决网络故障。

【技术实现步骤摘要】

本专利技术涉及分布式数据库中节点故障检测与解决,具体涉及用于检测和解决分布式数据库系统中的故障的方法和系统。


技术介绍

1、分布式数据库中的数据和元数据存储在相互通信的多个节点上。但是,节点之间有时会发生通信中断。例如,分布式数据库系统中的节点本身可能会处于不一致状态,从而发生崩溃或故障。在其他情况下,在分布式数据库系统内的节点上运行的虚拟机或进程可能崩溃或发生故障。在其他情况下,分布式数据库系统中的第一节点和第二节点之间的通信链路可能发生故障。例如,连接分布式数据库系统中的两个或多个节点的网络(例如,局域网、广域网、以太网等)可能发生故障,从而中断节点之间的通信。


技术实现思路

1、本文描述了分布式数据库系统。分布式数据库系统可以包括多个节点。多个节点中的每个节点可以包括对应的处理器和对应的存储器。多个节点中的每个节点可以与多个节点中的每个其他节点连接。多个节点中的第一节点处的处理器可以被配置为通过以下方式解决分布式数据库系统中的故障:识别多个节点中的可疑节点,向多个节点中的邻居节点广播第一可疑节点列表,从至少一个其他邻居节点接收第二可疑节点列表,基于连接信息确定第一节点是否在分布式数据库的获胜全连接组件中,响应于确定第一节点在多个节点的获胜全连接组件中,继续操作第一节点,并且响应于确定第一节点不在多个节点的获胜全连接组件中,使第一节点发生故障,从而解决故障。可疑节点可以是多个节点中由于分布式数据库系统故障而不再连接到第一节点的节点。第一可疑节点列表可以包括可疑节点。邻居节点可以是多个节点中在网络故障后仍然直接连接到第一节点的节点。获胜全连接组件可以包括多个节点中一半以上的节点,并且获胜全连接组件中的每个节点直接连接到获胜全连接组件中的每个其他节点。

2、本文描述了一种用于解决分布式数据库中的故障的方法。分布式数据库可以包括多个节点,多个节点中的每个节点可以直接连接到多个节点中的每个其他节点。该方法可以包括在多个节点中的第一节点处:检测与多个节点中的第二节点的通信中断,响应于检测到中断,在多个节点中的邻居节点之间发起相应可疑节点列表的协调广播,基于相应可疑节点列表确定连接信息,以及至少部分地基于连接信息解决故障。邻居节点可以是多个节点中仍然直接连接到第一节点的节点。第一节点的可疑节点列表包括第二节点。

3、本文描述了一种用于解决分布式数据库中的故障的方法。分布式数据库可以包括多个节点,多个节点中的每个节点可以连接到多个节点中的每个其他节点。该方法可以包括响应于检测到故障:在多个节点中的第一节点处:确定第一节点是否与多个节点中的至少一半节点连接,响应于确定第一节点直接与多个节点中少于一半的节点连接,使第一节点发生故障以至少部分地解决故障,响应于确定第一节点直接与多个节点中的至少一半节点连接,向多个节点中的邻居节点广播第一可疑节点列表,从邻居节点中的至少一个邻居节点接收第二可疑节点列表,确定第一可疑节点列表是否与第二可疑节点列表匹配,响应于确定第一可疑节点列表与第二可疑节点列表匹配,在故障的至少部分解决中保持第一节点运行,响应于确定第一可疑节点列表与第二可疑节点列表不匹配,基于第一可疑节点列表和第二可疑节点列表向邻居节点广播第一更新可疑节点列表,从邻居节点中的至少一个邻居节点接收至少一个第二更新可疑节点列表,至少部分地基于第一更新可疑节点列表和第二更新可疑节点列表确定多个节点的连接信息,基于连接信息确定分布式数据库的获胜全连接组件,确定第一节点是否在获胜全连接组件中,响应于确定第一节点在多个节点的获胜全连接组件中,继续操作第一节点以至少部分地解决故障,以及响应于确定第一节点不在多个节点的获胜全连接组件中,使第一节点发生故障以至少部分地解决故障。第一可疑节点列表可以包括不直接连接到第一节点的节点。邻居节点可以是在故障后仍直接连接到第一节点的节点。获胜全连接组件包括多个节点中一半以上的节点,并且获胜全连接组件节点中的每个节点直接连接到获胜全连接组件节点中的每个其他节点。

4、下面更详细地讨论前述概念和附加概念的所有组合(假设此类概念并不相互矛盾),其被认为是本文公开的专利技术主题的一部分。特别地,出现在本公开的结尾处的要求保护的主题的所有组合是本文公开的专利技术主题的一部分。在本文中使用的并且也可能出现在通过引用并入的任何公开中的术语应被赋予与本文公开的特定概念最一致的含义。

本文档来自技高网...

【技术保护点】

1.一种解决分布式数据库中影响节点的故障的方法,所述分布式数据库中的每个节点被配置为直接与所述分布式数据库中每个其它节点通信,所述方法包括:

2.根据权利要求1所述的方法,其中交换所述列表包括在所述分布式数据库中还未故障的所述节点的至多两轮协调广播中广播所述列表。

3.根据权利要求1所述的方法,其中交换所述列表包括由还未故障的所述节点中的一个广播协议迭代编号,所述协议迭代编号表示为解决故障而调用的故障解决协议。

4.根据权利要求3所述的方法,其中交换所述列表进一步包括响应于包括在所述列表中至少一个的所述协议迭代编号,由还未故障的所述节点中的至少一个递增本地协议迭代编号。

5.根据权利要求1所述的方法,其中除包括确定该节点的连接信息的故障外,确定还未故障的每个节点是否保持配置为直接与所述分布式数据库中一半以上的所述节点通信。

6.根据权利要求1所述的方法,其中除包括比较来自不同节点的所述列表的故障外,确定还未故障的每个节点是否保持配置为直接与所述分布式数据库中一半以上的所述节点通信。

7.根据权利要求1所述的方法,其中除所述故障外,确定还未故障的每个节点是否保持配置为直接与所述分布式数据库中一半以上的所述节点通信,其包括:

8.根据权利要求7所述的方法,其中识别所述获胜组包括:

9.根据权利要求7所述的方法,其中识别所述获胜组包括:

10.根据权利要求1所述的方法,其进一步包括,在交换所述列表之前:

...

【技术特征摘要】

1.一种解决分布式数据库中影响节点的故障的方法,所述分布式数据库中的每个节点被配置为直接与所述分布式数据库中每个其它节点通信,所述方法包括:

2.根据权利要求1所述的方法,其中交换所述列表包括在所述分布式数据库中还未故障的所述节点的至多两轮协调广播中广播所述列表。

3.根据权利要求1所述的方法,其中交换所述列表包括由还未故障的所述节点中的一个广播协议迭代编号,所述协议迭代编号表示为解决故障而调用的故障解决协议。

4.根据权利要求3所述的方法,其中交换所述列表进一步包括响应于包括在所述列表中至少一个的所述协议迭代编号,由还未故障的所述节点中的至少一个递增本地协议迭代编号。

5.根据权利要求1所述的方法,其中除...

【专利技术属性】
技术研发人员:S·博达格拉R·夏埃尔P·D·史密斯
申请(专利权)人:诺宝公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1