The invention belongs to the technical field of central resource management, and discloses an efficient multi-dimensional algorithm scheduling method and task server. The efficient multi-dimensional algorithm scheduling method uses task number and cluster node status to describe the load of nodes in the cluster and job-related data locality; and through the execution of tasks. Row time and data length describe the changes of nodes and jobs before and after scheduling. Value iteration strategy is used to solve the optimal scheduling strategy and dynamically adjust the locality of job data and job response time. Under the same machine environment and resources, the algorithm resource rate of the invention is higher and the processing speed is faster.
【技术实现步骤摘要】
一种高效的多维度算法调度方法、任务服务器
本专利技术属于中央资源管理
,尤其涉及一种高效的多维度算法调度方法、任务服务器。
技术介绍
目前,业内常用的现有技术是这样的:大数据的分布式调度是在进行数据ETL过程中起到了总体的承上启下的角色,整个数据的生产、交付、消费都会贯穿其中,用户作业提交后,系统会将其划分为多个任务,通过调度算法策略将任务分配到哪个任务服务器上来执行。FIFO是Hadoop默认的调度器,其优点是算法简单,便于实现,其缺点为仅以作业进入队列的先后顺序作为调度依据,无法针对作业的不同需求进行差异化调度.Spark提出一种公平调度(FairScheduler),在多用户共享集群的环境下,最大化地保证系统中的作业能平均分配到集群的资源.公平调度器能最大限度地满足公平性原则,但无法满足数据本地性要求。还有一种延迟调度(DelayScheduling)算法,为队首作业设置延迟等待时间,当空闲节点出现时,如果此节点包含队首作业所需数据,则立刻执行队首作业,否则先调度其它作业,在队首作业的等待时间超过阈值时,立即执行队首作业.延迟调度策略能够很好地做到公平性与数据本地性之间的均衡,延迟调度的等待时间是通过配置文件进行静态设置的,无法满足集群负载动态变化的情况。综上所述,现有技术存在的问题是:(1)FIFO以任务进入队列的先后顺序作为调度依据,按照任务提交或进程变为就绪状态的先后次序,分派CPU;当前任务或进程占用CPU,直到执行完或阻塞,才出让CPU(非抢占方式)。在任务或进程唤醒后(如I/O完成),并不立即恢复执行,通常等到当前任务或进程出让CP ...
【技术保护点】
1.一种高效的多维度算法调度方法,其特征在于,所述高效的多维度算法调度方法使用任务数和集群节点状态来描述集群中节点的负载情况和作业相关的数据本地性情况;通过任务的执行时间和数据长度描述调度前后节点和作业的变化,利用值迭代策略求解算法求解最优调度策略,动态调节作业数据本地性与作业响应时间。
【技术特征摘要】
1.一种高效的多维度算法调度方法,其特征在于,所述高效的多维度算法调度方法使用任务数和集群节点状态来描述集群中节点的负载情况和作业相关的数据本地性情况;通过任务的执行时间和数据长度描述调度前后节点和作业的变化,利用值迭代策略求解算法求解最优调度策略,动态调节作业数据本地性与作业响应时间。2.如权利要求1所述的高效的多维度算法调度方法,其特征在于,所述高效的多维度算法调度方法在运行数据处理的集群中,将选择一个节点作为Master,该节点是控制集群任务的核心部件,完成任务调度与监控功能,根据当前集群负载状态和不同任务的数据本地性需求,求取一个最优调度策略;通过以下指标智能决策建立的数学模型:T:任务的执行时间;N:每个节点的任务数;S:每个节点服务器状态;L:每条数据的长度;C:阈值控制。3.如权利要求2所述的高效的多维度算法调度方法,其特征在于,建立TNSL的形式化描述模型具体包括:T:任务执行时间用来描述线程执行函数的时间,单次任务执行的时间表示:Li:每条数据的单词大小;所有数据的单词总大小;Tt:所有数据处理的总时间;F(t):单条数据处理的时间。4.如权利要求2所述的高效的多维度算法调度方法,其特征在于,N:任务种类用来描述每个处理节点上分配的处理任务,根据各个节点上分配的任务种类,实时调度各节点下次分配的任务;每次任务种类的计算公式...
【专利技术属性】
技术研发人员:张宝华,隗公程,程国艮,
申请(专利权)人:中译语通科技股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。