组合计算装置和方法制造方法及图纸

技术编号:7837718 阅读:174 留言:0更新日期:2012-10-12 02:30
提供一种组合计算装置和方法,所述装置包括:输入设定单元,配置为接收与多组输入数据相关的第一设定和与所述多组输入数据之间的组合方式相关的第二设定;数据获取单元,配置为根据所述第一设定和第二设定,获取由多组输入数据构成的数据组合;以及至少一个组合操作单元,配置为对所述数据组合进行所需的计算操作。本发明专利技术还提供了与上述装置对应的系统和方法。通过上述装置和方法,改进了现有的并行计算方式,使得并行计算的设计和操作更加简单,提高了并行计算系统的性能和效率。

【技术实现步骤摘要】

本专利技术涉及分布式并行计算系统,更具体而言,涉及并行计算系统中进行组合计算的装置和方法。
技术介绍
信息技术的发展为人们提供了越来越丰富和强大的应用和服务,同时也对处理设备的运算能力提出了越来越高的要求。尽管处理器的运行速度也在不断提高,但是面对海量信息和数据,分布式并行计算成为一种实用的解决方式。分布式并行计算是将一个处理任务分散到多个处理器中同时并行执行的方案。目 前,已经存在多种大规模并行计算的执行方式,其中最为重要和常用的是MapReduce模型。MapReduce是一种简洁的并行计算模型,其名字源于这个模型中的两项核心操作映射(Map)和规约(Reduce),这两个概念来自于函数式编程语言(FunctionProgramming)。简单地说,Map是把一组数据一对一地映射为另外的一组数据,其映射的规则由用户定义的一个函数来指定。Reduce是根据用户定义的函数对一组数据进行合并和规约。在Map过程中,数据被并行地分开、独立处理,而在Reduce过程中,分开的数据被合并到了一起。因此,利用Map和Reduce操作的一分一合,就可以将一个复杂庞大的任务分拆成许多个作业并行执行运算,然后对并行运算的结果进行综合,从而得到期望的结果。图I示出现有技术MapReduce模型的基本架构的示意图。在图I所示的映射规约模型中,每个映射单元从对应的数据源读取键值对(k,v)形式的输入数据,根据用户定义的函数,将输入键值对(k,v)映射为新的键值对,称为中间键值对。之后,在规约阶段,将具有相同键的中间键值对发往相同的规约单元,由规约单元对结果进行综合。如上所述,在现有的MapReduce模型中,输入数据必须遵从单个键值对的输入形式。也就是说,映射单元只能对单个键值对(k,v)进行操作,因此只能支持单个数据源的输入。然而,对于很多应用来说,单个键值对形式的输入要求对于并行计算设计来说过于严格。实际上,在许多应用中,将多个数据源作为输入数据,并希望对多个数据源进行组合运算。这时,现有的MapReduce模型就带来了很大的局限性。下面结合两个例子说明多组输入数据的组合运算的情况。在一个例子中,利用并行计算系统对阵列天线进行配置。由于阵列天线的各种信息都是以矩阵形式进行存储,因此计算系统需要对大型矩阵进行各种运算。对于m* s的矩阵A,如果要计算A乘以一个常数\的结果,那么在现有的MapReduce模型下,可以将输入键值对(kl,vl)设定为kl =矩阵行号,Vl =对应行的矩阵元素,并将映射函数设定为f(kl,vl) = (kl, X vl),从而得到映射后的键值对(k2, v2) = f (kl, vl),以此键值对表示乘以常数之后的结果。然而,如果要计算矩阵A乘以另一个s * n的矩阵B的结果,根据矩阵乘法的定义,必然要同时对A、B两个矩阵的元素进行组合操作,也就需要将两个矩阵的元素同时作为输入数据。在现有MapReduce计算系统下,由于映射单元只能接受单个键值对作为输入,因此编程人员往往要通过非常复杂的算法将矩阵B的元素拆分和分发,并设定复杂的输入键值对来实现两个矩阵的乘法运算。在另一个例子中,利用并行计算系统实现推荐功能,这一功能广泛应用在各种购物网站中。具体地,在用户m购买某商品n之后,系统会记录用户m对该商品n的评分Rm_n,用于分析商品之间的相似度S。在获得任意商品之间的相似度的基础上,在用户购买某商品i时,系统可以计算出与商品i具有最大相似度S的商品,并将这样的商品推荐给用户。一般地,用于计算相似度的评分数据以矩阵、表格等形式记录在例如HDFS (Hadoop DistributedFile System)的共享文件中。为了计算商品之间的相似度,在一种算法中,商品i与商品j之间的相似度被定义为本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种组合计算装置,位于并行计算系统中,包括 输入设定单元,配置为接收与多组输入数据相关的第一设定和与所述多组输入数据之间的组合方式相关的第二设定; 数据获取单元,配置为根据所述第一设定和第二设定,获取由多组输入数据构成的数据组合; 至少一个组合操作单元,配置为对所述数据组合进行所需的计算操作。2.根据权利要求I的装置,其中所述第一设定包括所述多组输入数据的数据源的信息和输入数据的格式设定。3.根据权利要求2的装置,其中所述输入数据的格式设定包括将输入数据设定为键值对的形式。4.根据权利要求2的装置,其中所述输入设定单元还配置为,针对所述至少一个组合操作单元进一步限定所述第一设定中的数据源的信息。5.根据权利要求1-4中任一项的装置,其中所述数据获取单元包括 数据读取模块,配置为根据所述第一设定读取多组输入数据;以及 数据组合模块,配置为根据所述第二设定对所读取的多组输入数据进行组合,形成所述数据组合。6.根据权利要求I的装置,其中所述数据获取单元配置为,根据特定规则将所述数据组合组织为单组数据的形式;所述至少一个组合操作单元还配置为,基于所述特定规则将所述单组数据还原为包含多组输入数据的数据组合。7.根据权利要求I的装置,其中所述至少一个组合操作单元包含用于接收操作函数的接口,并根据所接收的操作函数对所述数据组合进行计算操作。8.一种并行计算系统,...

【专利技术属性】
技术研发人员:林海波李严杨雨东刘弢
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1