一种基于血缘的任务调度优化方法、系统、设备及介质技术方案

技术编号：36957219 阅读：53 留言：0更新日期：2023-03-22 19:17

本发明专利技术公开了一种基于血缘的任务调度优化方法、系统、设备及介质，涉及任务调度优化技术领域，该方法包括：步骤A：将分布式任务调度平台中需要自动配置工作流的任务进行血缘解析，得到任务数据血缘；步骤B：将步骤A中得到的任务数据血缘，通过血缘关系构建任务依赖图DAG；步骤C：基于步骤B中构建的任务依赖图DAG，进行任务调度执行。该系统包括：血缘解析单元、任务依赖图构建单元和任务调度执行单元。本发明专利技术通过血缘解析减少了人工配置任务依赖工作量和错误率，通过自动生成的有向无环图DAG也提高了包含的任务数大小。提高了包含的任务数大小。提高了包含的任务数大小。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于血缘的任务调度优化方法、系统、设备及介质

[0001]本专利技术涉及任务调度优化
，具体涉及一种基于血缘的任务调度优化方法、系统、设备及介质。

技术介绍

[0002]分布式任务调度平台(Apache DolphinScheduler)是一个分布式去中心化，易扩展的可视化有向无环图DAG工作流任务调度平台。分布式任务调度平台(Apache DolphinScheduler)旨在解决复杂的大数据任务依赖关系，并为应用程序提供数据和各种操作OPS编排中的关系；解决数据研发抽取转换加载ETL依赖错综复杂，无法监控任务健康状态的问题。DolphinScheduler以有向无环图DAG(Directed Acyclic Graph)流式方式组装任务，可以及时监控任务的执行状态，支持重试、指定节点恢复失败、暂停、恢复、终止任务等操作。其包含告警服务AlertServer进程提供告警服务，用户交互服务ApiServer进程提供Web服务用于用户编辑任务工作流等，主节点MasterServer进程负责调度工作流，工作节点WorkerServer进程负责实际执行任务，他们之间通过netty通信。
[0003]DolphinScheduler本身的DAG API即是有用户交互服务ApiServer提供的Web服务。但在大型企业中，特别是现在数据作为资产的时代，数据任务越来越多。如果直接ApiServer提供的DAG API进行工作流的创建，任务数达到几十时手动编辑就很困难，因为任务依赖关系需要人工检查手动设置。如果将...

【技术保护点】

【技术特征摘要】
1.一种基于血缘的任务调度优化方法，其特征在于，该方法包括以下步骤：步骤A：将分布式任务调度平台中需要自动配置工作流的任务进行血缘解析，得到任务数据血缘；步骤B：将步骤A中得到的任务数据血缘，通过血缘关系构建任务依赖图DAG；步骤C：基于步骤B中构建的任务依赖图DAG，进行任务调度执行。2.根据权利要求1所述的一种基于血缘的任务调度优化方法，其特征在于，所述步骤A的具体步骤为：步骤A1：当分布式任务调度平台中共有n个任务，其中假设task0～taskm为需要自动配置为虚拟工作流的任务；步骤A2：将任务task0～taskm进行血缘解析，得到任务数据血缘；所述任务数据血缘包括输入数据信息和输出数据信息；其中，以任务为键key、输出数据表信息为值value存入到hash表结构中，得到输出数据信息hash表hashtableout；以输入数据信息为键key、任务为值value存入到hash表结构中，得到输入数据信hash表hashtablein；并将无任何输入数据信息的任务存放在起点集合startset中。3.根据权利要求2所述的一种基于血缘的任务调度优化方法，其特征在于，所述输入数据信息和输出数据信息中的数据信息结构均包含任意条数据表项的信息，所述数据表项包括数据源名、数据库名和数据表名。4.根据权利要求1或2所述的一种基于血缘的任务调度优化方法，其特征在于，所述血缘解析为：若需要自动配置工作流的任务是SQL类任务，则通过进行SQL解析，得到任务数据血缘；若需要自动配置工作流的任务是非SQL类任务，则通过人工解析配置，得到任务数据血缘。5.根据权利要求2所述的一种基于血缘的任务调度优化方法，其特征在于，所述步骤B的具体步骤为：步骤B1：构造一个以任务task0～taskm为节点、任务依赖关系为边的有向无环图DAG；步骤B2：以步骤A2中得到的任务集合startset作为当前处理任务集合currenttasks进行遍历，并创建下一个遍历任务集合nexttasks；步骤B3：对当前处理任务集合currenttasks中的某一任务taski，获取该任务taski的输出数据信息outdatai；步骤B4：遍历所述输出数据信息outdatai中的数据表项；步骤B5：对输出数据信息outdatai中的数据表项，以数据表项为键key，从步骤A2的输入数据信hash表hashtablein中得到下游任务taskj；步骤B6：向步骤B1中的有向无环图DAG添加一条该任务节点指向下游任务节点的有向边，同时将下游任务节点加入下一个遍历任务集合nexttasks中；步骤B7：重复步骤B5～B6，直至输出数据信息o...

【专利技术属性】
技术研发人员：毛晶，陈卫，
申请(专利权)人：四川新网银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人