一种基于数据迁移的数据中心动态任务调度方法技术

技术编号：18763643 阅读：33 留言：0更新日期：2018-08-25 10:25

本发明专利技术公开了一种基于数据迁移的数据中心动态任务调度方法，其中在进行任务调度时，对于有空闲节点但是队列中没有可以满足本地执行的任务之情形，采用时间短的调度策略。以及，对于没有空闲节点但是队列中有任务在等待调度之情形，通过找到负载最小的节点，判断是否启用数据迁移来调度任务。本发明专利技术提供的方法除了进一步改进任务的调度策略之外，还通过改变数据块的部署位置来提高数据本地性。由于是从数据块的部署情况做出改进，所以不会影响任务调度的公平性。在任务执行过程中，根据任务进度和节点的负载情况，动态调整数据块的部署位置，可以进一步提高数据本地性，从而减少整个系统的任务执行时间，提高效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于数据迁移的数据中心动态任务调度方法
本专利技术涉及一种动态任务调度方法，特别涉及一种基于数据迁移的数据中心动态任务调度方法。
技术介绍
任务调度是分布式计算系统中非常重要的研究问题之一。对于大型的分布式系统，高效的任务调度机制既可以提高吞吐量，缩短任务的响应时间，又能够充分利用系统资源，减少能源消耗，从而带来更多的利润。Hadoop(由Apache基金会所开发的分布式系统基础架构)中的FIFO调度策略将任务按照到达时间排序，依次调度执行。这种方法实现机制简单，开销小，且易于理解。但当任务数不断增加时，FIFO很容易延长系统整体的响应时间，导致低效率。因此人们从很多方面着手研究如何提升分布式系统处理任务的性能。在共享系统中，影响系统性能的因素有很多，主要包括数据本地性、容错机制以及系统资源的共享和感知等等。任务的数据本地性在提升系统性能上占有十分重要的地位。所谓数据本地性，简单来说是指任务和任务执行所需要的数据在同一个节点，这样在执行任务的过程中所需要的数据就可以直接从本节点获取而不需要经过网络传输从别的节点获得，所以任务可以很快的执行结束。这样既提高了系统的执行效率，又减轻了系统的网络负担，因此在分布式计算系统中，我们总是尽可能希望提高任务的数据本地性。为了提高任务的数据本地性，人们研究出了延迟调度算法。在一个繁忙的系统上，如果一个进程请求某个节点，那么极有可能此时该节点正在被其他进程占用。显而易见的处理是，立刻放宽本地性需求，在同一机架中分配一个节点。然而，通过实践发现，此时如果等待一小段时间(不超过几秒)，能够戏剧性的增加在所请求的节点上分配到...

【技术保护点】
1.一种基于数据迁移的数据中心动态任务调度方法，其特征在于包括：Ⅰ、设定任务队列，其中有多个任务排队等待执行；以及，设定系统，其中包含有多个作为节点的服务器和多个不同数据块，其中每一数据块在系统中存在多个副本，每一服务器有多个存储空间，该多个存储空间分别用以存储多个数据块副本；Ⅱ、以服务器处理任务，其中每一任务要得到执行，均需要服务器中的相应的一个输入数据块，在任务执行时，若任务运行的服务器与所需输入数据所在的服务器是同一个服务器，则认为该任务是在本地执行，而若任务运行的服务器与所需输入数据所在的服务器不是同一个服务器，则认为该任务是在远程执行；Ⅲ、将时间划分为时间片，从0开始；Ⅳ、进行任务调度，包括如下步骤：(1)时间片从0开始，每个时间片都要检查服务器的状态，如果存在空闲的服务器，转入步骤(2)，如果没有则转入步骤(3)；(2)将队列中的任务按照优先级进行排序，依次调度；(3)若系统中没有空闲服务器，但队列中有任务在等待执行，则选择第一个待调度的任务，此时按下如下方法判断是否启用数据迁移，包括：(3‑1)找到系统中负载最小即可最快结束任务变为空闲状态的服务器，如果该服务器上没有部署...

【技术特征摘要】
1.一种基于数据迁移的数据中心动态任务调度方法，其特征在于包括：Ⅰ、设定任务队列，其中有多个任务排队等待执行；以及，设定系统，其中包含有多个作为节点的服务器和多个不同数据块，其中每一数据块在系统中存在多个副本，每一服务器有多个存储空间，该多个存储空间分别用以存储多个数据块副本；Ⅱ、以服务器处理任务，其中每一任务要得到执行，均需要服务器中的相应的一个输入数据块，在任务执行时，若任务运行的服务器与所需输入数据所在的服务器是同一个服务器，则认为该任务是在本地执行，而若任务运行的服务器与所需输入数据所在的服务器不是同一个服务器，则认为该任务是在远程执行；Ⅲ、将时间划分为时间片，从0开始；Ⅳ、进行任务调度，包括如下步骤：(1)时间片从0开始，每个时间片都要检查服务器的状态，如果存在空闲的服务器，转入步骤(2)，如果没有则转入步骤(3)；(2)将队列中的任务按照优先级进行排序，依次调度；(3)若系统中没有空闲服务器，但队列中有任务在等待执行，则选择第一个待调度的任务，此时按下如下方法判断是否启用数据迁移，包括：(3-1)找到系统中负载最小即可最快结束任务变为空闲状态的服务器，如果该服务器上没有部署当前待调度的任务所需的数据，转入步骤(3-2)，否则不进行任何操作，进入下一时间片；(3-2)比较如下两个时间，即：任务等待服务器转为空闲状态的时间，以及，将任务所需数据块迁移到该服务器上的时间；如果前者>后者，则启用数据迁移，否则转入步骤(3-3)；(3-3)比较如下两个时间，即：任务先等待服务器变为空闲状态，再在该服务器上远程执行的总时间；以及，先将任务所需数据迁移到该服务器上，再本地执行的总时间；如果前者＞后者，则启用数据迁移，否则不进行任何操作，进入下一时间片。2.如权利要求1所述的基于数据迁移的数据中心动态任务调度方法，其...

【专利技术属性】
技术研发人员：李鑫，汪良媛，秦小麟，
申请(专利权)人：南京航空航天大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人