The embodiment of the invention provides a MapReduce model of task based method and device, the method includes: extracting for each input file to perform the task of key value pairs; the maximum value of difference histogram will be divided into multiple segmentation sets; consistent hashing algorithm using multiple key calculation in the set of segmentation in key with the reduce node mapping; executing task execution according to the mapping relationship. The load balance of reduce node is realized, which improves the efficiency of task execution.
【技术实现步骤摘要】
本专利技术实施例涉及计算机
,尤其涉及一种基于MapReduce模型的任务执行方法和装置。
技术介绍
MapReduce模型是当下并行处理技术中的主流编程模型,其将任务抽象为基于键值对的map任务和Reduce任务。图1为现有技术基于MapReduce模型的任务执行方法。如图1所示,现有技术中基于MapReduce模型的任务执行方法主要分为以下几个步骤:步骤101,将任务的输入文件划分为M份。步骤102,执行Map任务的节点读取相应的分区块,并从输入文件的数据记录中提取出键值对,传入map函数,map函数对这些键值对进行处理,产生的中间键值存入缓存或者本地磁盘。步骤103,选择哈希函数作用于中间键,并产生0~R-1个桶编号。根据哈希结果将Map任务的结果存放到R个本地文件中的一个。步骤104,执行Reduce任务的节点远程地读取R个文件中相应的一个,采用取模的方式,将键值与关联的值传递给reduce函数,reduce函数产生的输出会添加到这个分区的输出文件中。现有技术中的MapReduce模型的任务执行方法中,由于Map任务执行完生成键值对,将键值对发送给reduce任务的节点时,遵循相同的键值被发送至同一个reduce节点的原则。因此,在key取值不均的情况下,容易造成reduce任务中节点的负载不均衡的问题,这种不均衡会造成轻负载的reduce节点等待重负载的reduce节点的现象,任务重的reduce节点将会拖慢整体的执行效率。所以现有的基于MapReduce模型的任务执行方法导致了reduce节点上的负载不均衡,进而导致了任务的执行效率较低 ...
【技术保护点】
一种基于MapReduce模型的任务执行方法,其特征在于,包括:提取待执行任务的每个输入文件的键值对;采用最大差异直方图将所述键值对划分为多个分割集合;采用哈希一致性算法计算多个分割集合中的键值对中的键值与reduce节点的映射关系;根据所述映射关系执行待执行任务。
【技术特征摘要】
1.一种基于MapReduce模型的任务执行方法,其特征在于,包括:提取待执行任务的每个输入文件的键值对;采用最大差异直方图将所述键值对划分为多个分割集合;采用哈希一致性算法计算多个分割集合中的键值对中的键值与reduce节点的映射关系;根据所述映射关系执行待执行任务。2.根据权利要求1所述的方法,其特征在于,所述提取待执行任务的每个输入文件的键值对之前,还包括:将所述待执行任务划分为多个的输入文件;读取所述输入文件。3.根据权利要求1或2所述的方法,其特征在于,所述采用哈希一致性算法计算多个分割集合中的键值对中的键值与reduce节点的映射关系具体包括:对所述多个分割集合中的每个键值对进行哈希运算,生成每个键值对的键值对应的一个或多个哈希值;对每个reduce节点的地址进行哈希运算,生成每个reduce节点对应的哈希值;根据每个键值对的键值对应的每个哈希值和reduce节点对应的哈希值,建立每个键值对的键值和reduce节点的映射关系。4.根据权利要求3所述的方法,其特征在于,所述根据每个键值对的键值对应的每个哈希值和reduce节点对应的哈希值,建立每个键值对的键值和reduce节点的映射关系,具体包括:获取哈希值大于键值的哈希值的reduce节点;查找与所述键值的哈希值的差值最小的第一reduce节点;将所述键值映射到所述第一reduce节点上。5.根据权利要求4所述的方法,其特征在于,所述每个reduce节点的地址为所...
【专利技术属性】
技术研发人员:傅文卿,石卫平,马宝军,许宁,侯玉娜,金潇,靳会勤,朱丹萍,谭燕燕,于秀丽,张晓宁,郭嘉,张铮,王淑玲,
申请(专利权)人:中国联合网络通信集团有限公司,联通信息导航有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。