基于数据仓库的优化任务调度方法、装置、设备及介质制造方法及图纸

技术编号:24573921 阅读:23 留言:0更新日期:2020-06-21 00:06
本申请公开了一种基于数据仓库的优化任务调度方法、装置、设备及介质,属于数据仓库领域。该方法包括:获取第一任务节点在数据仓库中的执行路径;在执行路径中确定第一任务节点对应的最长依赖路径,最长依赖路径是第一任务节点和执行路径上的其他任务节点之间形成的最长路径;根据最长依赖路径生成依赖关系集,依赖关系集中的集合元素用于表示最长依赖路径上两个任务节点之间的依赖关系;根据依赖关系集显示优化界面,优化界面包括关键任务节点,关键任务节点是影响第一任务节点进行执行时间优化的任务节点;响应于优化指令,对关键任务节点的执行时间进行优化。提高了数据仓库的优化任务调度的效率。

Optimized task scheduling method, device, equipment and media based on data warehouse

【技术实现步骤摘要】
基于数据仓库的优化任务调度方法、装置、设备及介质
本申请涉及数据仓库
,特别涉及一种基于数据仓库的优化任务调度方法、装置、设备及介质。
技术介绍
数据仓库(DataWarehouse,DW)是一种用于为企业的决策提供多种类型的支持数据的数据存储集合。任务调度系统是数据仓库的重要组成部分,用于调度数据仓库的计算资源完成各个任务处理,各个任务之间存在依赖关系。相关技术中,每个任务执行完成后,根据任务之间的依赖关系执行下一个任务,各个任务之间存在时效性,如任务A完成后,才能执行任务B。若任务A未在预设时间内完成,则任务B的开始执行时间也会延迟,数据仓库工程师需要根据任务之间的依赖关系确定任务延迟的原因(也即找到任务A所在的节点),解决对应的延迟问题。基于上述情况,各个任务节点存在多个依赖关系,通过依赖关系确定任务延迟执行的原因需要耗费较多时间。
技术实现思路
本申请实施例提供了一种基于数据仓库的优化任务调度方法、装置、设备及介质,使得数据仓库工程师能够在多个依赖关系中快速确定影响优化的关键任务节点,提高了数据仓库的任务调度的优化效率。所述技术方案如下:根据本申请的一个方面,提供了一种基于数据仓库的优化任务调度方法,所述方法包括:获取第一任务节点在所述数据仓库中的执行路径;在所述执行路径中确定所述第一任务节点对应的最长依赖路径,所述最长依赖路径是所述第一任务节点和所述执行路径上的其他任务节点之间形成的最长路径;根据所述最长依赖路径生成依赖关系集,所述依赖关系集中的集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系;根据所述依赖关系集显示优化界面,所述优化界面包括关键任务节点,所述关键任务节点是影响所述第一任务节点进行执行时间优化的任务节点;响应于优化指令,对所述关键任务节点的执行时间进行优化。在一个可选的实施例中,所述根据所述最长依赖路径生成依赖关系集,包括:根据所述最长依赖路径生成第一依赖关系集,所述第一依赖关系集中的每个第一集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系;根据最大执行时间差和所述第一依赖关系集生成第二依赖关系集,所述第二依赖关系集中的每个第二集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系以及优化执行时间,所述最大执行时间差是所述第二集合元素中的被依赖任务节点的结束执行时间和依赖任务节点的开始执行时间的最大差值。在一个可选的实施例中,所述任务节点还包括:第二任务节点和第三任务节点,所述第二任务节点依赖于所述第三任务节点;所述根据最大执行时间差和所述第一依赖关系集生成第二依赖关系集,包括:获取所述第一任务节点的开始执行时间、所述第二任务节点的开始执行时间和结束执行时间、所述第三任务节点的结束执行时间;结合所述开始执行时间和所述结束执行时间,对所述第一依赖关系集进行处理,得到中间依赖关系集,所述中间依赖关系集中的每个中间集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系以及执行时间差,所述执行时间差是所述中间集合元素中的被依赖任务节点的结束执行时间和依赖任务节点的开始执行时间的差值;从所述中间依赖关系集中获取所述最大执行时间差,结合所述最大执行时间差对所述中间依赖关系集进行处理,得到所述第二依赖关系集。在一个可选的实施例中,所述结合所述最大执行时间差对所述中间依赖关系集进行处理,得到所述第二依赖关系集,包括:计算所述优化执行时间,所述优化执行时间是所述执行时间差与所述最大执行时间差的差值;结合所述优化执行时间,对所述中间依赖关系集进行处理,得到所述第二依赖关系集。在一个可选的实施例中,所述方法还包括:根据所述第一依赖关系集确定所述各个任务节点在所述最长依赖路径上的任务节点层级;根据所述任务节点层级生成第三依赖关系集,所述第三依赖关系集中的每个第三集合元素用于表示所述各个任务节点在所述最长依赖路径上的所述任务节点层级。在一个可选的实施例中,所述优化界面还包括如下信息中的至少一种:所述关键任务节点的N个上游任务节点、经过优化的执行效果和优化建议;其中,N为正整数。在一个可选的实施例中,所述任务节点包括:用于执行信息推送任务的任务节点、用于执行商品销售任务的任务节点、用于执行就餐管理任务的任务节点、用于执行酒店管理任务的任务节点中的任意一种。根据本申请的另一方面,提供了一种基于数据仓库的优化任务调度装置,所述装置包括:获取模块,用于获取第一任务节点在所述数据仓库中的执行路径;处理模块,用于在所述执行路径中确定所述第一任务节点对应的最长依赖路径,所述最长依赖路径是所述第一任务节点和所述执行路径上的其他任务节点之间形成的最长路径;生成模块,用于根据所述最长依赖路径生成依赖关系集,所述依赖关系集中的集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系;显示模块,根据所述依赖关系集显示优化界面,所述优化界面包括关键任务节点,所述关键任务节点是影响所述第一任务节点进行执行时间优化的任务节点;所述处理模块,用于响应于优化指令,对所述关键任务节点的执行时间进行优化。根据本申请的另一方面,提供了一种计算机设备,所述计算机设备包括:处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的基于数据仓库的优化任务调度方法。根据本申请的另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上方面所述的基于数据仓库的优化任务调度方法。本申请实施例提供的技术方案带来的有益效果至少包括:通过将第一任务节点对应的最长依赖路径生成依赖关系集,并自动根据依赖关系集显示优化界面,即使在多个依赖关系中,也能够快速确定影响第一任务节点进行执行时间优化的关键任务节点,从而对该关键任务节点进行优化,提高了数据仓库的优化任务调度的效率。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请一个示例性实施例提供的优化界面的界面示意图;图2是本申请一个示例性实施例提供的计算机系统的框图;图3是本申请一个示例性实施例提供的基于数据仓库的任务调度方法的流程图;图4是本申请另一个示例性实施例提供的基于数据仓库的任务调度方法的流程图;图5是本申请另一个示例性实施例提供的优化界面的界面示意图;图6是本申请一个示例性实施例提供的结合应用场景的基本文档来自技高网...

【技术保护点】
1.一种基于数据仓库的优化任务调度方法,其特征在于,所述方法包括:/n获取第一任务节点在所述数据仓库中的执行路径;/n在所述执行路径中确定所述第一任务节点对应的最长依赖路径,所述最长依赖路径是所述第一任务节点和所述执行路径上的其他任务节点之间形成的最长路径;/n根据所述最长依赖路径生成依赖关系集,所述依赖关系集中的集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系;/n根据所述依赖关系集显示优化界面,所述优化界面包括关键任务节点,所述关键任务节点是影响所述第一任务节点进行执行时间优化的任务节点;/n响应于优化指令,对所述关键任务节点的执行时间进行优化。/n

【技术特征摘要】
1.一种基于数据仓库的优化任务调度方法,其特征在于,所述方法包括:
获取第一任务节点在所述数据仓库中的执行路径;
在所述执行路径中确定所述第一任务节点对应的最长依赖路径,所述最长依赖路径是所述第一任务节点和所述执行路径上的其他任务节点之间形成的最长路径;
根据所述最长依赖路径生成依赖关系集,所述依赖关系集中的集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系;
根据所述依赖关系集显示优化界面,所述优化界面包括关键任务节点,所述关键任务节点是影响所述第一任务节点进行执行时间优化的任务节点;
响应于优化指令,对所述关键任务节点的执行时间进行优化。


2.根据权利要求1所述的方法,其特征在于,所述根据所述最长依赖路径生成依赖关系集,包括:
根据所述最长依赖路径生成第一依赖关系集,所述第一依赖关系集中的每个第一集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系;
根据最大执行时间差和所述第一依赖关系集生成第二依赖关系集,所述第二依赖关系集中的每个第二集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系以及优化执行时间,所述最大执行时间差是所述第二集合元素中的被依赖任务节点的结束执行时间和依赖任务节点的开始执行时间的最大差值。


3.根据权利要求2所述的方法,其特征在于,所述任务节点还包括:第二任务节点和第三任务节点,所述第二任务节点依赖于所述第三任务节点;
所述根据最大执行时间差和所述第一依赖关系集生成第二依赖关系集,包括:
获取所述第一任务节点的开始执行时间、所述第二任务节点的开始执行时间和结束执行时间、所述第三任务节点的结束执行时间;
结合所述开始执行时间和所述结束执行时间,对所述第一依赖关系集进行处理,得到中间依赖关系集,所述中间依赖关系集中的每个中间集合元素用于表示所述最长依赖路径上两个任务节点之间的依赖关系以及执行时间差,所述执行时间差是所述中间集合元素中的被依赖任务节点的结束执行时间和依赖任务节点的开始执行时间的差值;
从所述中间依赖关系集中获取所述最大执行时间差,结合所述最大执行时间差对所述中间依赖关系集进行处理,得到所述第二依赖关系集。


4.根据权利要求3所述的方法,其特征在于,所述结合所述最大执行时间差对所述中间依赖关系集进行处理,得到所述第二依赖关系集,包括:
计算所述优化执行时间,所述优化执行时间是所...

【专利技术属性】
技术研发人员:喻灿
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1