容错方法、计算机系统、装置、电子设备及存储介质制造方法及图纸

技术编号:33042340 阅读:15 留言:0更新日期:2022-04-15 09:23
本申请实施例提供了一种容错方法、计算机系统、装置、电子设备及存储介质,计算机系统包括多个计算机节点,每个计算机节点均配置容错中间件,容错中间件中预先设置多种处理机制,在计算机节点运行任务的过程中,检测到运行出现错误时,容错中间件判断错误的类型,第一类型的错误为不可恢复的错误,第二类型的错误为可恢复的错误。当错误为第一类型的错误时,停止运行该任务;当错误为第二类型的错误时,基于预先设置的处理机制,对错误进行处理。本申请实施例提供的方法,使得计算机系统可以容许第二类型的错误出现,避免计算机节点出现错误时直接退出任务,能够提升计算机系统的容错能力,提高计算机系统的稳定性。提高计算机系统的稳定性。提高计算机系统的稳定性。

【技术实现步骤摘要】
容错方法、计算机系统、装置、电子设备及存储介质


[0001]本申请属于计算机应用
,尤其涉及一种容错方法、计算机系统、装置、电子设备及存储介质。

技术介绍

[0002]人们在工作、娱乐等活动中会产生大量的数据,当单个计算机的处理能力无法满足对数据的计算和存储需求时,可以考虑使用分布式系统。分布式系统由多个相互协调的计算机为节点组成,分布式系统将一个任务分为多个子任务,将多个子任务分配给多个节点进行处理,在任务运行过程中,某些节点可能会出现错误,比如网络错误,导致整个任务运行终止。
[0003]目前,解决错误的方法是设置主备节点,主节点和备用节点负责处理同一个子任务,当主节点运行出现错误时,将执行任务的节点切换为备用节点。然而,主节点和备用节点可能会同时发生错误,从而导致整个任务运行终止。

技术实现思路

[0004]针对上述技术问题,本申请实施例提供一种容错方法、计算机系统、装置、电子设备及存储介质,通过设置对错误进行处理的处理机制,避免主节点和备用节点同时发生错误时任务运行终止的问题。
[0005]第一方面本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种容错方法,其特征在于,应用于计算机系统,所述计算机系统包括多个计算机节点,所述方法包括:在所述计算机节点运行任务的过程中,检测到所述计算机节点运行出现错误时,判断错误的类型;当所述错误为第一类型的错误时,停止运行所述任务,所述第一类型的错误为不可恢复的错误;当所述错误为第二类型的错误时,基于预先设置的处理机制,对所述错误进行处理,所述第二类型的错误为可恢复的错误。2.根据权利要求1所述的方法,其特征在于,所述当所述错误为第二类型的错误时,基于预先设置的处理机制,对所述错误进行处理,包括:检测是否接收到第一信息,所述第一信息用于预先设置处理机制;当接收到第一信息时,根据所述第一信息,对所述错误进行处理。3.根据权利要求2所述的方法,其特征在于,所述处理机制按照时间紧急度划分为多个等级,所述第一信息用于从多个等级的处理机制中选择一个等级的处理机制作为预先设置的处理机制。4.根据权利要求2所述的方法,其特征在于,所述第一信息是在所述计算机节点接收到任务处理请求时接收的。5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:在所述计算机节点停止运行所述任务后,重新启动所述计算机节点。6.根据权利要求5所述的方法,其特征在于...

【专利技术属性】
技术研发人员:汪小益李伟刘毅恒蔡亮尚璇
申请(专利权)人:杭州趣链科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1