【技术实现步骤摘要】
科学工作流调度处理方法及装置
本专利技术涉及数据处理领域,具体涉及科学工作流调度处理方法及装置。
技术介绍
网格就是通过将大规模的、分散的、异构的计算资源、存储资源、数据资源等整合起来实现一个全球的为科学研究、商业运营等提供虚拟服务的网络基础设施。近些年来越来越多的科学领域例如生物医学、地理、天体物理等开始使用网格来进行学科内和学科间的大数据集的分享、管理与处理。在这种大数据、密集计算的环境下,科学工作流在网格中的应用显得越来越重要。采用科学工作流的主要目的在于可以将处理大数据的复杂过程模块化、不透明化,可以实现把需要多次计算、重复计算的过程简单地调用和复用,可以将一个大的工作流程分阶段化并且分配到不同的计算资源上实现并行化以减少时间提高效率。一个安排好的工作流可以根据既定的子工作块的依赖关系和资源分布实现过程执行的自动化,最大化节省资源和提高使用的满意度,因此工作流的调度问题成为网格计算中工作流管理应用的关键。调度即为将具有内部关联的不同任务映射到异构的资源上进行执行的过程。在网格环境下一个科学工作流应用通常表示为一个有向无回路图(DirectedAcyclicGraph,缩写DAG),每个节点代表一个任务,图的边代表了各个任务间的依赖关系。节点的权重代表了任务的大小,边的权重代表了任务结束输出文件的大小。由于DAG调度问题是一个NP复杂度的问题,无法使用严格的数学推导得出最优的调度策略,目前国内外的众多学者提出了很多启发式和元启发式算法。与此同时工作流的调度算法又可以分为两大类即基于尽力而为(Best-Effort)和基于服务质量控制(QoS- ...
【技术保护点】
一种科学工作流调度处理方法,其特征是,包括如下步骤:S10,查询作为目标的异构计算资源,记录每个异构计算资源的计算能力PCj,其中,PCj表示第j个异构计算资源的计算能力;S20,查询作为目标的科学工作流中所有可调度的任务;S30,计算所有可调度的任务中的每个任务ti在可利用的第j个异构计算资源rj上的任务百分比p(ti,rj):p(ti,rj)=ext(ti,rj)ct(ti,rj)×PCjPC;]]>执行完成时间ct(ti,rj)=ext(ti,rj)+rt(ti,rj);其中,ext(ti,rj)是指第i个任务ti在第j个异构计算资源rj上的执行时间,rt(ti,rj)表示是指任务ti在异构计算资源rj开始执行前的等待时间,执行完成时间ct(ti,rj)是指任务ti在异构计算资源rj上的执行完成时间;PC是指所述作为目标的异构计算资源的计算能力中最高的计算能力;S40,在获取的所有的任务百分比中,获取最大的任务百分比p(tm,rn),将对应的第m个任务tm调度到第n个异构计算资源rn上执行。
【技术特征摘要】
1.一种科学工作流调度处理方法,其特征是,包括如下步骤:S10,查询作为目标的异构计算资源,记录每个异构计算资源的计算能力PCj,其中,PCj表示第j个异构计算资源的计算能力;S20,查询作为目标的科学工作流中所有可调度的任务;S30,计算所有可调度的任务中的每个任务ti在可利用的第j个异构计算资源rj上的任务百分比p(ti,rj):执行完成时间ct(ti,rj)=ext(ti,rj)+rt(ti,rj);其中,ext(ti,rj)是指第i个任务ti在第j个异构计算资源rj上的执行时间,rt(ti,rj)表示是指任务ti在异构计算资源rj开始执行前的等待时间,执行完成时间ct(ti,rj)是指任务ti在异构计算资源rj上的执行完成时间;PC是指所述作为目标的异构计算资源的计算能力中最高的计算能力;S40,在获取的所有的任务百分比中,获取最大的任务百分比p(tm,rn),将对应的第m个任务tm调度到第n个异构计算资源rn上执行。2.如权利要求1所述的科学工作流调度处理方法,其特征是,在步骤S40之后还包括如下步骤:若一个任务tx在不同的异构计算资源上的任务百分比相同,则优先将所述任务tx调度到所述不同的异构计算资源中的一个异构计算资源ry上,其中在所述不同的异构计算资源中,所述任务tx在所述异构计算资源ry上的执行完成时间最小。3.如权利要求1所述的科学工作流调度处理方法,其特征是,在步骤S40之后还包括如下步骤:若存在不同的任务在一个异构计算资源上的任务百分比相同,则优先调度所述不同的任务中调度损失最大的一个任务tx,其中,所述调度损失是指任务在所有目标异构计算资源上的次小执行完成时间与最小执行完成时间的差值。4.如权利要求1所述的科学工作流调度处理方法,其特征是,在步骤S30中:rt(ti,rj)=Max(art(ti,rj),att(ti,rj));其中,art(ti,rj)是指由于异构计算资源rj正在执行其他任务而需要任务ti等待的第一等待时间;att(ti,rj)是指在任务ti能被异构计算资源rj获取前任务ti等待的第二等待时间。5.如权利要求4所述的科学工作流调度处理方法,其特征是,在步骤S10中还包括:获取相邻异构计算资源之间的资源传输带宽;根据任务ti输出的从前一个异构计算资源输送至所述异构计算资源rj的文件大小、以及所述前一个异构计算资源至所述异构计算资源rj之间的资源传输带...
【专利技术属性】
技术研发人员:李秀,宋靖东,
申请(专利权)人:清华大学深圳研究生院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。