The invention discloses a method and device for job scheduling, which involves the field of Internet technology to solve the data migration of the non localization computing in the existing Hadoop cluster, and the data migration will cause the waste of time, which leads to the reduction of computing efficiency. The method of the present invention includes selecting the idle Task Tracker node by scheduling the use state of the Task Tracker node according to each task; selecting the target Task Tracker node from the idle Task Tracker node; looking for the target operation for the target Task Tracker node; scheduling the target job to the mesh. The standard Task Tracker node is calculated. The invention is suitable for application in the process of Hadoop cluster job scheduling.
【技术实现步骤摘要】
作业调度的方法及装置
本专利技术涉及互联网
,尤其涉及一种作业调度的方法及装置。
技术介绍
在Hadoop集群中,调度器是一个非常重要的组件,它的作用是保证整个集群内有效地进行作业的调度与执行。在Hadoop集群中通常有多个队列,每个队列中又包含有用户提交的多个作业,每个作业代表一个应用,每个作业中可以包含多个任务。当调度器进行作业调度时,通常的调度方式为:按照预设规则选择一个队列,然后根据预设的条件对队列中的作业设置优先级,再按照优先级的次序调度作业,并为作业选择与之匹配的计算节点。通常匹配的计算节点是按照本地主机资源、同机架主机资源、其他机架主机资源的顺序进行选择的。然而上述常用的调度器的调度方式,会造成非本地化计算的增加。例如,当某一作业A被调度时,有可能对应的本地主机资源已经占满,无空闲计算节点,因此只能在同机架的其他主机或者不同机架的其他主机上选择空闲的计算节点进行计算。当作业量很大时,有可能将其他非本地主机的资源占满,这样就会造成本地主机计算的是非本地的作业,而本地作业无法在本地主机计算。然而非本地化计算由于存在数据迁移,数据迁移会造成时间的浪费,从而非本地化计算的增加必然会降低计算的效率。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种作业调度的方法及装置。为解决上述技术问题,一方面,本专利技术提供了一种作业调度的方法,该方法包括:根据各任务调度TaskTracker节点的使用状态,选择空闲的TaskTracker节点;从空闲的TaskTracker节点中选择符合预设条件的目标TaskT ...
【技术保护点】
1.一种作业调度的方法,其特征在于,所述方法包括:根据各任务调度Task Tracker节点的使用状态,选择空闲的Task Tracker节点;从空闲的Task Tracker节点中选择符合预设条件的目标Task Tracker节点;为所述目标Task Tracker节点查找目标作业;将所述目标作业调度至目标Task Tracker节点进行计算。
【技术特征摘要】
1.一种作业调度的方法,其特征在于,所述方法包括:根据各任务调度TaskTracker节点的使用状态,选择空闲的TaskTracker节点;从空闲的TaskTracker节点中选择符合预设条件的目标TaskTracker节点;为所述目标TaskTracker节点查找目标作业;将所述目标作业调度至目标TaskTracker节点进行计算。2.根据权利要求1所述的方法,其特征在于,所述为所述目标TaskTracker节点查找目标作业,包括:若存在同主机作业,则按照优先级的顺序从所述同主机作业中查找目标作业,所述同主机作业为申请的资源是所述目标TaskTracker节点所属的主机的资源的作业;若不存在同主机作业,则按照优先级的顺序从同机架作业中查找目标作业,所述同机架作业为申请的资源是与所述目标TaskTracker节点所属的主机为同机架的其他主机的资源的作业。3.根据权利要求2所述的方法,其特征在于,所述为所述目标TaskTracker节点查找目标作业,还包括:若不存在同机架作业,则按照优先级顺序从最久未调度的作业中查找目标作业。4.根据权利要求2或3中任一所述的方法,其特征在于,在按照优先级顺序查找目标作业之前,所述方法进一步包括:根据当前时间与作业的提交时间之间的间隔时长、提交作业的用户的等级以及作业申请的资源量确定对应的作业的优先级。5.根据权利要求1所述的方法,其特征在于,在所述将所述目标作业调度至目标TaskTracker节点进行计算之后,所述方法进一步包括:判断是否存在未调度的作业;若存在未调度的作业,则继续选择目标TaskTracker节点;若不存在未调度的作业,则结束调度。6.一种作业调度的装置,其特征在于,所述装置包括...
【专利技术属性】
技术研发人员:薛戬,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。