【技术实现步骤摘要】
【国外来华专利技术】分布式数据处理的任务调度
[0001]本主题大体上涉及分布式数据处理,具体地,本主题涉及分布式数据处理的任务调度。
技术介绍
[0002]分布式系统是一组通过网络互连的计算设备,对于并行处理大量数据非常有用,例如用于大数据分析。数据处理任务分布在设备上,以提高可靠性和可扩展性,提供更快的数据处理,并缩短响应时间。在一些分布式系统架构中,其中一个设备充当主设备,在被称为从设备的其余设备之间分发和调度任务。用于大数据处理的分布式系统,例如Apache Spark、Map Reduce、Hive,既是数据密集型系统,也是内存密集型系统,其中,广泛使用任务调度机制。
技术实现思路
[0003]本专利技术的各方面提供了用于任务调度以提高分布式系统的资源利用率的方法和设备。分布式系统也称为分布式数据处理系统。
[0004]根据第一方面,提供了一种在分布式数据处理系统中进行任务调度的方法。所述方法包括:选定节点接收待执行的第一任务、所述第一任务的优先级指示和用于挂起所述节点正在执行的运行任务的第一指令。所述运行任务被所述节点挂起,并保存与所述运行任务相关联的任务资源。此外,所述第一任务由所述节点执行,并且在所述第一任务执行期间,基于所述第一任务的资源需求,从所述挂起的运行任务中顺序地释放资源。在所述第一任务完成时,所述节点向主设备发送关于所述第一任务完成的确认。
[0005]根据第二方面,提供了在一种分布式数据处理系统中进行任务调度的方法。所述方法包括:主设备从多个节点中确定用于执行第一任务的节点; ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种在分布式数据处理系统中进行任务调度的方法,其特征在于,所述方法包括:节点(104)从主设备(102)接收待执行的第一任务、所述第一任务的优先级指示和用于挂起运行任务的第一指令;所述节点(104)挂起所述运行任务,并保存与所述运行任务相关联的任务资源;所述节点(104)执行所述第一任务,并基于正在执行的所述第一任务的资源需求,从所述挂起的运行任务中顺序地释放资源;所述节点(104)向所述主设备(102)发送关于所述第一任务完成的确认。2.根据权利要求1所述的方法,其特征在于,从所述挂起任务中顺序地释放资源,包括:所述节点(104)在第一实例中仅释放中央处理单元(central processing unit,CPU)资源,而不释放与所述挂起任务相关联的除所述CPU以外的资源(406)。3.根据权利要求2所述的方法,其特征在于,除所述CPU以外的所述资源包括与所述挂起任务相关联的数据(406)和打开句柄(404)。4.根据权利要求2所述的方法,其特征在于,从所述挂起任务中顺序地释放资源,包括:所述节点(104)确定在仅释放所述CPU之后,所述第一任务的所述资源需求是否增加;通过基于所述确定的资源需求将与所述挂起任务相关联的数据(406)溢出到磁盘(504),以增量方式释放与所述挂起任务相关联的内存(406)。5.根据权利要求4所述的方法,其特征在于,所述从所述挂起任务中顺序地释放资源,包括:确定在仅释放所述CPU并以增量方式释放与所述挂起任务相关联的所述内存(406)之后,所述第一任务的所述资源需求是否增加;确定数据检查点设置方法是否可实现;基于所述确定,挂起具有数据检查点设置的任务或抢占所述挂起任务。6.根据权利要求1所述的方法,其特征在于,所述方法包括:所述节点(104)响应于所述确认,从所述主设备(102)接收用于恢复所述挂起任务的第二指令;所述节点(104)从所述运行任务被挂起的状态恢复所述挂起任务。7.根据权利要求6所述的方法,其特征在于,恢复所述挂起任务包括将所述CPU资源重新分配给所述挂起进程,并检索与所述挂起任务相关联的数据。8.根据权利要求7所述的方法,其特征在于,所述方法包括如果对所述挂起任务执行了数据检查点设置,则从先前的检查点恢复所述挂起任务。9.根据权利要求1所述的方法,其特征在于,所述第一任务的所述优先级指示高于所述运行任务的优先级。10.一种包括指令的非瞬时性计算机可读介质,其特征在于,所述指令当被处理器执行时,使所述处理器执行根据权利要求1至9中任一项所述的方法。11.一种在分布式数据处理系统中执行任务的节点(104),其特征在于,所述节点(104)包括:处理器(300);任务执行模块(302),可由所述处理器(300)执行,以:从主设备(102)接收待执行的第一任务、所述第一任务的优先级指示和用于挂起运行
任务的第一指令;挂起所述运行任务,并保存与所述运行任务相关联的任务资源;执行所述第一任务,并向所述主设备(102)发送关于所述第一任务完成的确认;资源管理模块(304),可由所述处理器(300)执行,以:监控所述节点(104)处的资源可用性和正在执行的所述第一任务的资源需求;基于所述第一任务的所述资源需求,从所述挂起的运行任务中顺序地释放资源。12.根据权利要求11所述的节点(104),其特征在于,所述资源管理模块(304)在第一实例中仅释放CPU资源,而不释放与所述挂起任务相关联的除所述CPU以外的资源(406)。13.根据权利要求12所述的节点(104),其特征在于,除所述CPU以外的所述资源包括与所述挂起任务相关联的内存(406)和打开句柄。14.根据权利要求102所述的节点(104),其特征在于,所述资源管理模块(...
【专利技术属性】
技术研发人员:文卡塔,
申请(专利权)人:华为云计算技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。