【技术实现步骤摘要】
本专利技术实施例涉及计算机
,尤其涉及一种数据处理作业调度方法、装置及系统。
技术介绍
在进行数据处理的流程中,特别是大数据领域比较复杂的数据处理流程中,通常是将数据处理流程划分为若干作业对数据进行处理。这些作业之间有的需要依赖其他作业的正确运行结果才能够运行,有的作业之间并无这种依赖关系,可以并发运行。而整个数据处理流程的全部作业均运行成功,数据处理流程才会认为运行成功,如果一个作业依赖的前提作业还未运行或运行失败,该作业即开始执行,则会造成数据错误,数据处理流程也会认为运行失败,因此需要对作业进行有效的调度。现有技术的一种数据处理作业调度方法中,是由技术人员根据数据处理流程中各个作业之间的依赖关系,首先将各个作业划分多个执行阶段。根据依赖关系可知,这些执行阶段之间存在执行顺序。在进行作业调度时,即按照执行阶段的执行顺序,分阶段的进行作业调度,每一个阶段的作业全部运行成功之后,再调度下一个阶段中的作业执行。比如,假设数据处理流程包括作业A、B、C、D、E,作业A为数据处理流程中的初始作业,作业E为最终的作业,作业B和作业C分别依赖作业A的运行结果,作业D依赖作业B的运行结果,作业E依赖作业C和作业D的执行结果。因此根据各个作业之间的依赖关系,划分的执行阶段为:第一个执行阶段包括作业A;由于作业C分别与作业B和作业D不存在依赖关系,可以放在一个执行阶段并发执行,而作业B和作业D之间存在依赖关系,不
能放在一个执行阶段执行,因此第二执行阶段只包括作业B和作业C,作业D划分为第三执行阶段;第四执行阶段即包括作业E。由上述描述过程可知,现 ...
【技术保护点】
一种数据处理作业调度方法,其特征在于,包括:获取预先配置的数据处理流程的各个作业之间的依赖关系;初始化数据处理流程的各个作业的运行状态为不可运行,生成第一更新指令;响应所述第一更新指令,按照所述数据处理流程的各个作业之间的依赖关系,将不存在前提作业的作业的运行状态更新为可以运行;调度运行状态为可以运行的作业运行,根据运行结果更新所述作业的运行状态为运行成功或运行失败,并生成第二更新指令;响应所述第二更新指令,按照所述数据处理流程的各个作业之间的依赖关系,将存在前提作业,且所述前提作业的运行状态均为运行成功的作业的运行状态,更新为可以运行。
【技术特征摘要】
1.一种数据处理作业调度方法,其特征在于,包括:获取预先配置的数据处理流程的各个作业之间的依赖关系;初始化数据处理流程的各个作业的运行状态为不可运行,生成第一更新指令;响应所述第一更新指令,按照所述数据处理流程的各个作业之间的依赖关系,将不存在前提作业的作业的运行状态更新为可以运行;调度运行状态为可以运行的作业运行,根据运行结果更新所述作业的运行状态为运行成功或运行失败,并生成第二更新指令;响应所述第二更新指令,按照所述数据处理流程的各个作业之间的依赖关系,将存在前提作业,且所述前提作业的运行状态均为运行成功的作业的运行状态,更新为可以运行。2.根据权利要求1所述的方法,其特征在于,调度运行状态为可以运行的作业运行,并根据运行结果更新所述作业的运行状态为运行成功或运行失败,生成第二更新指令之后,所述方法还包括:响应所述第二更新指令,按照所述数据处理流程的各个作业之间的依赖关系,将存在前提作业,且任一前提作业运行状态为运行失败或放弃运行的作业的运行状态,更新为放弃运行。3.根据权利要求1所述的方法,其特征在于,所述调度运行状态为可以运行的作业运行包括:将运行状态为可以运行的作业提供给多个计算节点,由至少一个计算节点运行至少一个运行状态为可以运行的作业。4.根据权利要求1所述的方法,其特征在于,所述数据处理流程的各个作业之间的依赖关系通过有向无环图表示;获取预先配置的数据处理流程的各个作业之间的依赖关系包括:获取预先配置的表示数据处理流程的各个作业之间的依赖关系有向无环图;所述响应所述第一更新指令,按照所述数据处理流程的各个作业之间的依赖关系,将不存在前提作业的作业的运行状态更新为可以运行包括:响应所述第一更新指令,按照所述有向无环图表示的数据处理流程的各个作业之间的依赖关系,将不存在前提作业的作业的运行状态更新为可以运行;所述响应所述第二更新指令,按照所述数据处理流程的各个作业之间的依赖关系,将存在前提作业,且所述前提作业的运行状态均为运行成功的作业的运行状态,更新为可以运行包括:响应所述第二更新指令,按照所述有向无环图表示的所述数据处理流程的各个作业之间的依赖关系,将存在前提作业,且所述前提作业的运行状态均为运行成功的作业的运行状态,更新为可以运行。5.一种数据处理作业调度装置,其特征在于,包括:作业调度模块,用于初始化数据处理流程的各个作业的运行状态为不可运行,生成第一更新指令;调度运行状态为可以运行的作业运行,根据运行结果更新所述作业的运行状态为运行成功或运行失败,并生成第二更新指令;规则确定模块,用于获取预先配置的数据处理流程的各个作业...
【专利技术属性】
技术研发人员:许鹭清,陈抒,
申请(专利权)人:乐视网信息技术北京股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。