This application concerns the field of distributed system, especially the resource scheduling technology in distributed system. In a task assignment method, the share of the allocated resource of the user is obtained, a task to be allocated from the list of tasks to be allocated, and based on the maximum threshold, is assigned to the remaining resource that the remaining resources can satisfy the first computing node of the assigned task, and the assigned task is assigned to the stated section. After a computing node, the first calculation node has at least one of the remaining quantities of the monitored resource greater than or equal to the calculation node of the highest threshold corresponding to one of the monitored resources. The scheme provided by this application can reduce the generation of resource fragments in distributed system and improve the resource utilization of distributed system.
【技术实现步骤摘要】
一种分布式系统任务分配的方法和装置
本申请涉及分布式系统领域,尤其涉及分布式系统中的资源调度技术。
技术介绍
在各种分布式计算框架(如hadoop、spark等)以及分布式资源统一管理与调度平台(如mesos和yarn)中,细粒度、多维度的资源调度是分布式计算框架和分布式资源统一管理与调度平台的一个核心问题。而在资源调度时,如何实现资源的公平分配和资源利用率的提高是一个关键问题,也是当前分布式资源管理与调度
中的热门话题。目前一些主流的分布式资源管理与调度框架如Mesos、Yarn等都采用了DRF(DominantResourceFairness,主导资源公平)算法。该算法的主要思想是在多维度资源环境下,一个用户的资源分配应该由用户的dominantshare(主导份额)决定,dominantshare是在所有已经分配给用户的多种资源中,占据总资源的最大值,该值对应的资源为主导资源。DRF算法的主旨是试图最大化所有用户中最小的dominantshare,或者尽可能使不同用户的主导资源相等。DRF算法虽然保证了用户资源公平性,但对任务的分配存在资源碎片问题。即通过DRF算法进行资源调度后,可能出现每个节点的剩余资源都不足以满足某一任务的资源需求,但是从分布式系统整体来看,各个节点上该种剩余资源的总和却又大于该任务的资源需求,从而造成了资源碎片。资源碎片问题会导致资源利用率降低,并且由于资源碎片不能被应用,导致一些任务执行延迟,时间性能降低。
技术实现思路
本文描述了一种分布式系统任务分配方法,装置及系统,以减少分布式系统中的资源碎片,提高系统资源利用率和任 ...
【技术保护点】
1.一种分布式系统任务分配的方法,其特征在于,所述方法用于将多个用户的待分配任务分配到分布式系统中的多个计算节点中,所述方法包括:获取用户的已分配资源的份额,所述份额为已分配给所述用户的一种资源的数量与所述资源在所述分布式系统中的可分配总量的比值,所述用户的已分配的资源中份额最高的资源为所述用户的主导资源,所述主导资源对应的份额为所述用户的主导份额;从任务列表中选择一个待分配任务,所述待分配任务为在所述多个用户中主导份额最低的用户的任务;若所述多个计算节点中存在第一计算节点,将所述待分配任务分配给第一计算节点,其中,所述第一计算节点为剩余资源量能够满足所述待分配任务对资源的需求量的计算节点,且所述待分配任务分配到所述第一计算节点后,所述第一计算节点中存在至少一种被监测资源,所述一种被监测资源的剩余量大于或等于与该被监测资源对应的最高阈值。
【技术特征摘要】
1.一种分布式系统任务分配的方法,其特征在于,所述方法用于将多个用户的待分配任务分配到分布式系统中的多个计算节点中,所述方法包括:获取用户的已分配资源的份额,所述份额为已分配给所述用户的一种资源的数量与所述资源在所述分布式系统中的可分配总量的比值,所述用户的已分配的资源中份额最高的资源为所述用户的主导资源,所述主导资源对应的份额为所述用户的主导份额;从任务列表中选择一个待分配任务,所述待分配任务为在所述多个用户中主导份额最低的用户的任务;若所述多个计算节点中存在第一计算节点,将所述待分配任务分配给第一计算节点,其中,所述第一计算节点为剩余资源量能够满足所述待分配任务对资源的需求量的计算节点,且所述待分配任务分配到所述第一计算节点后,所述第一计算节点中存在至少一种被监测资源,所述一种被监测资源的剩余量大于或等于与该被监测资源对应的最高阈值。2.根据权利要求1所述方法,其特征在于,所述方法还包括,若所述多个计算节点中不存在第一计算节点,且存在第二计算节点,将所述待分配任务分配给第二计算节点,其中,所述第二计算节点为剩余资源量能够满足所述待分配任务对资源的需求量的计算节点,且所述待分配任务分配到所述第二节点后,所述第二节点种至少存在一种被监测资源,所述一种被监测资源的剩余量小于或等于与所述被检测资源相对应的最低阈值,所述最低阈值小于所述最高阈值。3.根据权利要求1或2所述方法,其特征在于,所述最高阈值大于或等于所述待分配任务列表中至少一个待分配任务对所述被监测资源的需求量。4.根据权利要求3所述方法,其特征在于,所述最高阈值大于或等于所述待分配任务列表中对所述被监测资源的需求量最小的N个未分配任务中每个任务对所述被监测资源的需求量的最大值,其中,N为大于或等于1且小于等于所述待分配任务列表中未分配任务总数的整数。5.根据权利要求1或2所述方法,其特征在于,所述第一计算节点中任意一种所述被监测资源的剩余量均大于或等于与所述任意一种被监测资源对应的最高阈值。6.根据权利要求5所述方法,其特征在于,所述最高阈值大于或等于至少一组任务中每组任务的所述一种被监测资源的最大需求量中的最大值,所述最大需求量为一组任务中每个任务的所述一种被监测资源的需求量的最大值,所述一组任务为所述待分配任务列表中的N个未分配任务,N为大于或等于1的整数。7.根据权利要求6所述方法,其特征在于,所述一组任务具体为:所述待分配任务列表中任意一种被监测资源需求量最小的N个未分配任务。8.根据权利要求1或2所述方法,其特征在于,所述方法还包括:获取采样任务数据,所述采样任务数据包含多个任务的对被监测资源的需求信息;根据所述采样任务数据,确定所述至少一种被监测资源相对应的最高阈值。9.根据权利要求8所述方法,其特征在于,所述根据所述采样任务数据,确定所述至少一种被监测资源相对应的最高阈值包括:确定被监测资源X对应的最小任务集合的被监测资源Y的最大需求量为所述被监测资源Y相对应最高阈值,其中,被监测资源X为任意一种被监测资源,被监测资源Y为所要确定相对应的最高阈值的被监测资源,所述被监测资源X对应的最小任务集合为所述采样任务数据中对所述被监测资源X的需求量最小的M个任务,所述最小任务集中每个任务对被监测资源Y的需求量的最大值为所述最小任务集的被监测资源Y的最大需求量,M为大于或等于1的正整数;或者,确定多种被监测资源对应的多个最小任务集合的被监测资源Y的最大需求量的最大值为所述被监测资源Y相对应最高阈值。10.根据权利要求8或9所述方法,其特征在于,所述方法还包括:获取至少一个更新采样任务数据,所述更新采样任务数据包括预设的时间段内执行的任务的资源需求信息;根据所述更新采样任务数据,更新至少一种资源相对应的最高阈值。11.一种管理节点,其特征在于,所述管理节点用于将多个用户的待分配任务分配到分布式系统中的多个计算节点中,所述管理节点包括:获取模块,用于获取用户的已分配资源的份额,所述份额为已分配给所述用户的一种资源的数量与所述资源在所述分布式系统中的可分配总量的比值,所述用户的已分...
【专利技术属性】
技术研发人员:曾艳,林宗芳,朱冠宇,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。