一种任务故障的分级恢复方法、装置及系统制造方法及图纸

技术编号:43286961 阅读:18 留言:0更新日期:2024-11-12 16:08
本说明书实施例提供了一种任务故障的分级恢复方法、装置及系统。当第一引擎终端中的第一任务状态异常时,第一引擎终端自身首先分别进行线程、进程级别的任务重试,如果第一任务仍然状态异常,则通过服务平台在同一中心机房的另一集群中确定能够执行第一任务的第二引擎终端,通过第二引擎终端重新执行第一任务。如果第一任务在第二引擎终端中仍然状态异常,则服务平台在第二中心机房中确定能够执行第一任务的第三引擎终端,通过第三引擎终端重新执行第一任务。通过分级的任务恢复方式逐级向上层的引擎终端尝试恢复任务。在任务恢复的过程中需要保护租户的隐私数据不泄露。

【技术实现步骤摘要】

本说明书一个或多个实施例涉及计算机,尤其涉及一种任务故障的分级恢复方法、装置及系统


技术介绍

1、在内容、尤其是视频为代表的内容快速发展的大背景下,服务平台也在做内容化、视频化的转型升级。在这种背景下,服务平台中针对各种数据的任务计算的计算量也大幅提升。因此,服务平台通常采用分布式的引擎计算架构来实现多种任务的计算。在进行任务计算的过程中,服务平台需要在对数据进行隐私保护的前提下提高任务的高效高质处理能力。尤其是针对流媒体数据实时任务的处理,为了应对可能的故障和异常情况,流媒体数据计算引擎需要设计容错机制。

2、目前,希望能有改进的方案,提高分布式计算架构下任务执行过程中的故障恢复率,使得系统请求执行具备高可用性。


技术实现思路

1、本说明书一个或多个实施例描述了一种任务故障的分级恢复方法、装置及系统,以解决提高分布式计算架构下任务执行过程中的故障恢复率,使得系统请求执行具备高可用性的问题。具体的技术方案如下。

2、第一方面,实施例提供了一种任务故障的分级恢复方法,通过服务平台执行,本文档来自技高网...

【技术保护点】

1.一种任务故障的分级恢复方法,通过服务平台执行,包括:

2.根据权利要求1所述的方法,所述确定能够执行所述第一任务的第二引擎终端的步骤,包括:

3.根据权利要求1所述的方法,所述在所述第二引擎终端中重新执行所述第一任务的步骤,包括:

4.根据权利要求3所述的方法,所述第一任务是流数据任务,所述任务信息中携带输入流数据的存储地址和输出流数据的存储地址以及任务处理参数。

5.根据权利要求1所述的方法,当确定所述第一引擎终端中执行的第一任务满足第一重试条件时,还包括:

6.根据权利要求1所述的方法,在确定所述第一任务满足第一重试条件...

【技术特征摘要】

1.一种任务故障的分级恢复方法,通过服务平台执行,包括:

2.根据权利要求1所述的方法,所述确定能够执行所述第一任务的第二引擎终端的步骤,包括:

3.根据权利要求1所述的方法,所述在所述第二引擎终端中重新执行所述第一任务的步骤,包括:

4.根据权利要求3所述的方法,所述第一任务是流数据任务,所述任务信息中携带输入流数据的存储地址和输出流数据的存储地址以及任务处理参数。

5.根据权利要求1所述的方法,当确定所述第一引擎终端中执行的第一任务满足第一重试条件时,还包括:

6.根据权利要求1所述的方法,在确定所述第一任务满足第一重试条件之前,还包括:

7.根据权利要求6所述的方法,还包括:

8.根据权利要求7所述的方法,所述确定所述第二引擎终端中执行的所述第一任务满足第二重试条件的步骤,包括:

9.根据权利要求8所述的方法,还包括:

10.一种任务故障的分级恢复方法,通过引擎终端执行,所述引擎终端包括第一引擎终端、第二引擎终端和第三引擎终端,第一中心机房包含第一集群和第二集群,所述第一引擎终端归属于所述第一集群,所述第二引擎终端归属于所述第二集群,所述第三引擎终端归属于第二中心机房;所述方法包括:

11.根据权利要求10所述的方法,所述第一引擎终端包含管理组件和执行组件,其...

【专利技术属性】
技术研发人员:左凌轩于中春肖豹孙小军陈天熠杨潇峰胡洪卫
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1