【技术实现步骤摘要】
基于数据仓库的优化任务调度方法、装置、设备及介质
本申请涉及数据仓库
,特别涉及一种基于数据仓库的优化任务调度方法、装置、设备及介质。
技术介绍
数据仓库(DataWarehouse,DW)是一种用于为企业的决策提供多种类型的支持数据的数据存储集合。任务调度系统是数据仓库的重要组成部分,用于调度数据仓库的计算资源完成各个任务处理,各个任务之间存在依赖关系。相关技术中,每个任务执行完成后,根据任务之间的依赖关系执行下一个任务,各个任务之间存在时效性,如任务A完成后,才能执行任务B。若任务A未在预设时间内完成,则任务B的开始执行时间也会延迟,数据仓库工程师需要根据任务之间的依赖关系确定任务延迟的原因(也即找到任务A所在的节点),解决对应的延迟问题。基于上述情况,各个任务节点存在多个依赖关系,通过依赖关系确定任务延迟执行的原因需要耗费较多时间。
技术实现思路
本申请实施例提供了一种基于数据仓库的优化任务调度方法、装置、设备及介质,使得数据仓库工程师能够在多个依赖关系中快速确定影响优 ...
【技术保护点】
1.一种基于数据仓库的优化任务调度方法,其特征在于,所述方法包括:/n获取第一任务节点在所述数据仓库中的执行路径;/n在所述执行路径中确定所述第一任务节点对应的最长依赖路径,所述最长依赖路径是所述第一任务节点和所述执行路径上的其他任务节点之间形成的最长路径;/n根据所述最长依赖路径生成依赖关系集,所述依赖关系集中的集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系;/n根据所述依赖关系集显示优化界面,所述优化界面包括关键任务节点,所述关键任务节点是影响所述第一任务节点进行执行时间优化的任务节点;/n响应于优化指令,对所述关键任务节点的执行时间进行优化。/n
【技术特征摘要】
1.一种基于数据仓库的优化任务调度方法,其特征在于,所述方法包括:
获取第一任务节点在所述数据仓库中的执行路径;
在所述执行路径中确定所述第一任务节点对应的最长依赖路径,所述最长依赖路径是所述第一任务节点和所述执行路径上的其他任务节点之间形成的最长路径;
根据所述最长依赖路径生成依赖关系集,所述依赖关系集中的集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系;
根据所述依赖关系集显示优化界面,所述优化界面包括关键任务节点,所述关键任务节点是影响所述第一任务节点进行执行时间优化的任务节点;
响应于优化指令,对所述关键任务节点的执行时间进行优化。
2.根据权利要求1所述的方法,其特征在于,所述根据所述最长依赖路径生成依赖关系集,包括:
根据所述最长依赖路径生成第一依赖关系集,所述第一依赖关系集中的每个第一集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系;
根据最大执行时间差和所述第一依赖关系集生成第二依赖关系集,所述第二依赖关系集中的每个第二集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系以及优化执行时间,所述最大执行时间差是所述第二集合元素中的被依赖任务节点的结束执行时间和依赖任务节点的开始执行时间的最大差值。
3.根据权利要求2所述的方法,其特征在于,所述任务节点还包括:第二任务节点和第三任务节点,所述第二任务节点依赖于所述第三任务节点;
所述根据最大执行时间差和所述第一依赖关系集生成第二依赖关系集,包括:
获取所述第一任务节点的开始执行时间、所述第二任务节点的开始执行时间和结束执行时间、所述第三任务节点的结束执行时间;
结合所述开始执行时间和所述结束执行时间,对所述第一依赖关系集进行处理,得到中间依赖关系集,所述中间依赖关系集中的每个中间集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系以及执行时间差,所述执行时间差是所述中间集合元素中的被依赖任务节点的结束执行时间和依赖任务节点的开始执行时间的差值;
从所述中间依赖关系集中获取所述最大执行时间差,结合所述最大执行时间差对所述中间依赖关系集进行处理,得到所述第二依赖关系集。
4.根据权利要求3所述的方法,其特征在于,所述结合所述最大执行时间差对所述中间依赖关系集进行处理,得到所述第二依赖关系集,包括:
计算所述优化执行时间,所述优化执行时间是所...
【专利技术属性】
技术研发人员:喻灿,
申请(专利权)人:北京三快在线科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。