一种分布式环境下的工作流任务调度方法技术

技术编号:14052586 阅读:102 留言:0更新日期:2016-11-26 00:15
本发明专利技术公开了一种分布式计算环境下的工作流任务调度方法,使用有向无环图来描述工作流任务和资源,根据节点权值信息和边权值信息计算平均任务执行时间和平均任务传输时间,以据此判断工作流任务类型并进行分类模型处理,将具有数据依赖关系的任务分割成了若干个独立的任务集,每个任务集包含一个或者若干个任务,且每个任务集中的多个任务具有数据依赖关系,从而将工作流任务转化成了“独立任务”。任务集将计算数据量比较大或者数据传输量比较大的任务聚拢在一起,同时降低了需要独立分配的任务数量,从整体上提高了后期任务调度性能。另外,当工作流任务数量增加时,仅需加强对任务的聚拢操作,无需再对所有的任务进行处理,具有更好的扩展性。

【技术实现步骤摘要】

本专利技术属于分布式计算下工作流任务调度技术、工作流任务建模技术,特别涉及一种分布式计算环境下的工作流任务调度方法。
技术介绍
分布式计算环境中任务调度是最重要的部分,并且在整个分布式基础设施中也发挥着不可替代的作用。分布式计算环境下的任务调度要求在考虑时间、成本、可靠性、可用性、吞吐量、资源利用率的情况下找到任务资源分配的最佳方案。分布式计算环境下的任务调度主要分为独立任务调度和工作流任务调度。工作流任务中包含了若干个任务,且这若干个任务间具有数据依赖关系。现有的方法在进行工作流任务调度时,以降低任务执行成本为主要目标,例如,基于小位置值规则的粒子群优化任务调度方法,根据小位置值规则更新粒子位置信息,收敛速度快,能够最小化任务调度执行成本;基于双目标优化的异构最早时间完成算法,充分考虑用户对预算和截止时间的要求进行任务调度,并取得了较好的效果。但是,上述算法均未考虑工作流任务之间的数据依赖关系对任务调度效果产生的影响,导致工作流任务通信成本较高、执行完成时间较长,工作流任务调度效率低下。
技术实现思路
本专利技术为解决现有技术中存在的以上问题,提供了一种分布式计算环境下的工作流任务调度方法,考虑了工作流任务之间的数据依赖关系对任务调度效果产生的影响,降低了工作流任务通信成本以及执行完成时间,提高了工作流任务调度效率。为了实现上述目的,本专利技术采用的技术方案是:一种分布式计算环境下的工作流任务调度方法,包括以下步骤:步骤1:使用有向无环图对需要进行调度的工作流任务进行描述,得到工作流任务有向无环图;使用有向无环图对分布式计算环境下的计算资源进行描述,得到计算资源有向无环图;步骤2:根据工作流任务有向无环图以及计算资源有向无环图,计算平均任务执行时间t1、平均数据传输时间t2;步骤3:若t1>t2,则被调度工作流任务为计算密集型任务,进入步骤4;若t1<t2,则所述工作流任务为IO密集型任务,进入步骤5;步骤4:根据计算密集型任务的有向无环图的节点权值进行所述有向无环图的更新和分解,得到若干个任务集,进入步骤6;步骤5:根据IO密集型任务的有向无环图的边权值进行所述有向无环图的更新和分解,得到若干个任务集,进入步骤6;步骤6:将得到的若干个任务集根据各任务集的计算数据量进行排序,并将计算资源根据其计算能力大小进行排序;步骤7:根据步骤6的排序结果,将计算数据量大的任务集分配给计算能力大的计算资源。上述方案中,所述步骤1包括工作流任务有向无环图中节点的总数为I,其中,第i个节点的权值wi表示任务计算数据量,i∈[1,2,…,I];工作流任务有向无环图中边的总数为M,其中,第m个边的权值vm表示任务之间的数据传输量,m∈[1,2,…,M];计算资源有向无环图中节点的总数为J,其中,第j个节点的权值wj表示资源计算能力,j∈[1,2,…,J];计算资源有向无环图中边的总数为N,其中,第n个边的权值vn表示资源间的数据传输能力,n∈[1,2,…,N];上述方案中,所述步骤2中平均任务执行时间t1计算公式为: t 1 = Σ i = 1 I w i Σ j = 1 J w j ]]>平均数据传输时间t2计算公式为: t 2 = Σ m = 1 M v i Σ n = 1 N v n ]]>上述方案中,所述步骤4包括以下几个步骤:步骤4.1:计算工作流任务有向无环图从根节点到每一个叶子节点路径上节点权值之和;步骤4.2:根据步骤4.1的计算结果选取工作流任务有向无环图中节点权值之和最大的路径,将选取的路径上的节点聚拢为一个根节点,将聚拢得到的根节点的权值更新为选取的路径各节点权值之和,将更新后的根节点从工作流任务有向无环图中剔除,被剔除的根节点构成一个独立的任务集;步骤4.3:重复步骤4.2,直至工作流任务有向无环图中的节点均为独立的任务集,得到若干个任务集,进入步骤6。上述方案中,所述步骤5包括以下几个步骤:步骤5.1:计算工作流任务有向无环图从根节点到每一个叶子节点路径上边权值之和;步骤5.2:根据步骤5.1的计算结果选取工作流任务有向无环图中边权值之和最大的路径,将选取的路径上的节点聚拢为一个根节点,将聚拢得到的根节点的权值更新为选取的路径各节点权值之和,将更新后的根节点从工作流任务有向无环图中剔除,被剔除的根节点构成一个独立的任务集;步骤5.3:重复步骤5.2,直至工作流任务有向无环图中的节点均为独立的任务集,得到若干个任务集,进入步骤6;上述方案中,所述步骤6中任务集的计算数据量为任务集中各任务的计算数据量之和。本专利技术的有益效果是:1)本专利技术中工作流任务模型处理时划分任务集的方法将计算数据量比较大或者数据传输量比较大的任务聚拢在一起,降低了需要独立分配的任务数量,从整体上提高了后期任务调度性能。2)当工作流任务数量增加时,本专利技术仅需加强对任务的聚拢操作,无需再对所有的任务进行处理,具有更好的扩展性。3)本专利技术考虑了工作流任务之间的数据依赖关系对任务调度效果产生的影响,通过工作流任务模型处理,将具有复杂数据依赖关系的工作流任务简化为看似相互独立的任务集,方便了后期进行高效的任务调度,降低了工作流任务通信成本以及执行完成时间,提高了工作流任务调度效率,满足了用户对任务高效处理的需求。附图说明图1为本专利技术中工作流任务模型处理示意图;图2为本专利技术中任务调度流程;、图3为本专利技术中计算密集型工作流任务有向无环图;图4为本专利技术中步骤4.1示意图;图5为本专利技术中步骤4.2示意图;图6为本专利技术中步骤4.3示意图图7为本专利技术中IO密集型工作流任务有向无环图;图8为本专利技术中步骤5.1示意图;图9为本专利技术中步骤5.2示意图;图10为本专利技术中步骤5.3示意图;具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201610511549.html" title="一种分布式环境下的工作流任务调度方法原文来自X技术">分布式环境下的工作流任务调度方法</a>

【技术保护点】
一种分布式计算环境下的工作流任务调度方法,其特征在于包括以下步骤:步骤1:使用有向无环图对需要进行调度的工作流任务进行描述,得到工作流任务有向无环图;使用有向无环图对分布式计算环境下的计算资源进行描述,得到计算资源有向无环图;步骤2:根据工作流任务有向无环图以及计算资源有向无环图,计算平均任务执行时间t1、平均数据传输时间t2;步骤3:若t1>t2,则被调度工作流任务为计算密集型任务,进入步骤4;若t1<t2,则所述工作流任务为IO密集型任务,进入步骤5;步骤4:根据计算密集型任务的有向无环图的节点权值进行所述有向无环图的更新和分解,得到若干个任务集,进入步骤6;步骤5:根据IO密集型任务的有向无环图的边权值进行所述有向无环图的更新和分解,得到若干个任务集,进入步骤6;步骤6:将得到的若干个任务集根据各任务集的计算数据量进行排序,并将计算资源根据其计算能力大小进行排序;步骤7:根据步骤6的排序结果,将计算数据量大的任务集分配给计算能力大的计算资源。

【技术特征摘要】
1.一种分布式计算环境下的工作流任务调度方法,其特征在于包括以下步骤:步骤1:使用有向无环图对需要进行调度的工作流任务进行描述,得到工作流任务有向无环图;使用有向无环图对分布式计算环境下的计算资源进行描述,得到计算资源有向无环图;步骤2:根据工作流任务有向无环图以及计算资源有向无环图,计算平均任务执行时间t1、平均数据传输时间t2;步骤3:若t1>t2,则被调度工作流任务为计算密集型任务,进入步骤4;若t1<t2,则所述工作流任务为IO密集型任务,进入步骤5;步骤4:根据计算密集型任务的有向无环图的节点权值进行所述有向无环图的更新和分解,得到若干个任务集,进入步骤6;步骤5:根据IO密集型任务的有向无环图的边权值进行所述有向无环图的更新和分解,得到若干个任务集,进入步骤6;步骤6:将得到的若干个任务集根据各任务集的计算数据量进行排序,并将计算资源根据其计算能力大小进行排序;步骤7:根据步骤6的排序结果,将计算数据量大的任务集分配给计算能力大的计算资源。2.根据权利要求1所述分布式计算环境下的工作流任务调度方法,其特征在于,所述步骤1包括工作流任务有向无环图中节点的总数为I,其中,第i个节点的权值wi表示任务计算数据量,i∈[1,2,…,I];工作流任务有向无环图中边的总数为M,其中,第m个边的权值vm表示任务之间的数据传输量,m∈[1,2,…,M];计算资源有向无环图中节点的总数为J,其中,第j个节点的权值wj表示资源计算能力,j∈[1,2,…,J];计算资源有向无环图中边的总数为N,其中,第n个边的权值vn表示资源间的数据传输能力,n∈[1,2,…,N]。3...

【专利技术属性】
技术研发人员:段贵多刘贵松罗光春秦科
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1