【技术实现步骤摘要】
数据中心中基于工作流关键路径的任务优化调度方法
本专利技术涉及一种数据中心中基于工作流关键路径的任务优化调度方法,属于云计算的
技术介绍
数据中心中针对任务的资源节点调度方法是云计算
中的主要研究内容。用户向数据中心提交需要部署在数据中心上的应用时,该应用是由需要数据中心进行处理的数据流和对这些数据进行分析的工作流所组成。其中用户需要数据中心进行处理的数据流可能是单一数据流,更多情况是多个数据流。资源节点调度方法负责给用户分配数据中心处理数据所需的资源节点,并确保分配给用户的每个资源节点都被有效、合理的利用。资源节点是利用虚拟化技术配置的虚拟服务器,该虚拟服务器上部署了用户提交的数据处理任务。数据中心针对任务的资源节点调度方法主要关注两方面:用户的资源节点需求预测与保证方法,以及数据中心对资源节点优化调度方法。其中:用户的资源节点需求预测与服务保证方法:数据中心通过对用户需求的预测调度相应数量的资源节点,以节省资源节点的租金花费;还要对资源节点合理设置在服务器集群中的物理区域,保障用户实现服务层次上的目标。为了更好地达到资源节点优化利用的目标,数据中心资源节点调度方法希望使用最少的资源节点来满足用户的服务需求。由于在运行环境中,用户对数据中心的资源节点需求、即其应用服务的处理数据工作量始终处于变化之中,导致用户对服务的期望与当前用户的实际资源节点使用情况存在差距。因此,数据中心的资源节点调度方法必须要利用概率统计等一系列数学方法快速、准确地预测应用服务处理数据的工作量,进而估计需要使用的资源节点数量。同时,依据未来一段时间用户对资源节点的需 ...
【技术保护点】
一种数据中心中基于工作流关键路径的任务优化调度方法,其特征在于:数据中心接收到用户提交并需要部署在数据中心上、由数据中心进行处理的数据流和对这些数据进行分析的工作流组成的应用时,数据中心根据应用的工作流中各个子任务之间的差异,确定影响系统性能的关键因素,根据优化目标和工作流特点对各个子任务执行性价比的比较,确定分配给各个子任务的资源节点,以使基于用户不同需求有效调度资源节点,使得租用的资源节点费用最优化或工作流的处理时间最优化:即实现单位资金所购买的数据处理能力最大化而节省资源的租金费用,或提高系统性价比和增强系统运行效率而降低工作流的处理时间,同时生成资源节点执行计划;该方法包括下列操作步骤:步骤1,数据中心设置每个应用的工作流的资源节点优化调度模型:该工作流的资源节点调度模型是遵循工作流的处理流程,根据用户实际需求对工作流中的子任务分配适宜数量的资源节点、即虚拟服务器,并生成执行计划;同时基于工作流子任务特性,评估资源节点分配的有效性,在不破坏工作流的逻辑结构前提下,优化工作流的资源节点使用数量;步骤2,根据已部署应用的工作流图确定工作流的下述特性:工作流的关键路径、使用资源节点的 ...
【技术特征摘要】
1.一种数据中心中基于工作流关键路径的任务优化调度方法,其特征在于:数据中心接收到用户提交并需要部署在数据中心上、由数据中心进行处理的数据流和对这些数据进行分析的工作流组成的应用时,数据中心根据应用的工作流中各个子任务之间的差异,确定影响系统性能的关键因素,根据优化目标和工作流特点对各个子任务执行性价比的比较,确定分配给各个子任务的资源节点,以使基于用户不同需求有效调度资源节点,使得租用的资源节点费用最优化或工作流的处理时间最优化:即实现单位资金所购买的数据处理能力最大化而节省资源的租金费用,或提高系统性价比和增强系统运行效率而降低工作流的处理时间,同时生成资源节点执行计划;该方法包括下列操作步骤:步骤1,数据中心设置每个应用的工作流的资源节点优化调度模型:该工作流的资源节点调度模型是遵循工作流的处理流程,根据用户实际需求对工作流中的子任务分配适宜数量的资源节点、即虚拟服务器,并生成执行计划;同时基于工作流子任务特性,评估资源节点分配的有效性,在不破坏工作流的逻辑结构前提下,优化工作流的资源节点使用数量;步骤2,根据已部署应用的工作流图确定工作流的下述特性:工作流的关键路径、使用资源节点的类型、工作流中子任务的计算能力与部署子任务时该类型资源节点的性价比;因工作流图中每个子任务的资源需求与计算能力各不相同,根据图论知识从该工作流图中寻找到一条关键路径,作为子任务资源节点优化调度方法的资源分配依据;步骤3,数据中心根据每个工作流子任务特性与各个子任务间的依赖关系,确定工作流图中的数据传输时间;步骤4,合并子任务:根据优化目标,对工作流图的子任务选择传输时间最大的边的两端子任务进行合并,生成新的复合子任务,减少子任务间数据传输时间:实际部署方法是将两个子任务部署在同一台物理机上,减少该两个子任务的资源节点间的数据传输时间;所述步骤4包括下列操作内容:(41)分别计算各个应用的工作流子任务间的数据传输的工作量,数据传输的工作量越大,则用于传输的时间消耗越大,所花费的租金越高;(42)为减少子任务间的数据传输时间,以子任务间数据传输工作量作为衡量传输费用的指标,从大到小依次将工作流图中传输时间最大的边两端的子任务进行合并,成为新的复合子任务;在对应用的工作流子任务进行合并时,会因不同的约束目标,造成其合并方法也有所不同:(A)在设定时间约束条件下,使用最少资源节点合并子任务的方法是:先确定工作流图的关键路径,根据关键路径上子任务的数据传输时间按照由高到低的顺序使用所述步骤(42)的路径合并方法,将关键路径上的子任务合并为新的复合子任务,减少数据传输的时间消耗;(B)在资源节点设定数量约束条件下,缩短应用工作流的子任务完成时间的合并方法是:先将工作流图中每个工作流子任务间的边按照数据传输时间的长短进行降序排序,再使用所述步骤(42)的子任务合并方法,对子任务进行合并,直到工作流中没有子任务与其它非复合子任务进行合并为止;(43)因规定合并过程中的复合子任务不再与其他子任务合并,故在没有任何子任务需要与其它非复合子任务合并时,合并过程结束;步骤5,调整工作流图;根据用户需求与约束条件,为用户分配资源节点;在为目标用户分配资源节点时,根据优化目标通过比较子任务的性价比来决定如何给各子任务分配资源节点,最终生成应用的执行计划;所述步骤5包括下列操作内容:(51)调整合并后的工作流图的结构,并确定新工作流图的关键路径;(52)根据优化目标,在设定时间约束条件下,执行资源节点优化调度方法:先为工作流的关键路径上的子任务分配资源节点,再为剩余的子任务分配能够达成优化目标所需的数量最少的资源节点;或者(53)根据优化目标,在资源节点设定数量的约束条件下,执行资源节点优化调度方法:利用穷举的方法优先为工作流的关键路径上的子任务分配资源节点,再为剩余的子任务分配能够达成优化目标所需的数量最少的资源节点。2.根据权利要求1所述的方法,其特征在于:所述工作流定义为一组子任务及其依赖关系,即一个以工作流图描述的应用的逻辑执行过程;所述工作流图是一幅有向无环图,图中的节点表示工作流的子任务,连接线或边表示各子任务之间的依赖关系,即子任务之间的数据传递;工作流的子任务是应用中分析数据的最小单元,不同子任务对于资源节点的使用需求与资源节点的处理能力存在着差异;数据中心基于每个应用的工作流子任务,根据用户实际需求分配设定数量的资源节点,最终形成该应用的执行计划。3.根据权利要求1所述的方法,其特征在于:所述资源节点是数据中心利用虚拟化技术在物理服务器上占有包括CPU、内存、硬盘存储空间与传输带宽的多种资源的虚拟服务器;所述执行计划是一组运行子任务的资源节点及该资源节点间的依赖关系;资源节点是对工作流分配资源的基本单位,即利用虚拟化技术生成的虚拟服务器;资源节点间的依赖关系表示虚拟服务器之间产生的数据传递;故执行计划是工作流与工作流的各子任务使用的资源节点数的集合。4.根据权利要求1所述的方法,其特征在于:所述工作流图的关键路径是根据子任务的数据处理能力计算得到的工作流图中的一条路径,关键路...
【专利技术属性】
技术研发人员:马华东,高一鸿,张海涛,丁鸿凯,赵纯,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。