【技术实现步骤摘要】
【国外来华专利技术】充分利用并行处理器用于数据处理的方法和系统
本专利技术总体涉及计算机,并且更具体地涉及用于充分利用并行处理器以用于在计算环境中的数据处理的计算机。
技术介绍
在如今的社会中,计算机系统司空见惯。可以在工作地、在家里或者在学校找到计算机系统。计算机系统可以包括用于处理和存储数据的数据存储系统或者盘存储系统。每天需要处理大量数据,并且当前趋势表明这些数量将在可预见的将来继续不断增加。一种用于缓解该问题的高效方式是通过使用去重。在去重系统下面的思想是通过对重复的数据进行定位并且仅存储它的第一出现来利用反复复制和转发可用数据的大量部分而无任何改变这样的事实。用指向存储的出现的指针替换后续部分,如果数据确实重复则这显著减少存储要求。处理很大量信息是待解决的关键问题,因此存在对例如通过使用并行工作的处理器的集合来改善处理的需要。在某些应用中,可以指派处理器集合以在若干级或者层中执行某个任务,并且可以用分级方式将任务反复拆分成子任务。系统的性能最终依赖于如何确切地将处理器分配给它们的子任务的布局,因此存在对于用于分级并行计算的改进的处理器布局的需求。因此,在本领域中存在对解决前述问题的需求。
技术实现思路
如提到的那样,处理在存储系统中出现的很大量信息和数据是待解决的关键问题。例如在数据去重(数据去重指减少和/或者消除冗余数据)中,使用分组块方法将数据对象——该数据对象可以是文件、数据流或者某个其它形式的数据——分解成称为组块的一个或者多个部分。在数据去重过程中,数据的重复副本被减少或者消除,从而相应地留下最少量的冗余副本或者数据的单个副本。使用去重过程提供诸多益处、比如减 ...
【技术保护点】
一种用于在多个初始化步骤之后充分利用多个并行处理器的集合、以在计算环境中由处理器设备对数据组块序列执行任务的方法,其中所述数据组块中的每个数据组块在若干时间步骤中且被多个层处理,所述多个层在所述时间步骤中的每个时间步骤被多个处理器中的至少一个处理器处置,所述方法包括:将所述多个并行处理器的所述集合根据所述多个并行处理器的所述集合的索引分割成不相交子集,从而所述不相交子集中的每个不相交子集的大小对应于被指派为在所述多个层之一处理所述数据组块的多个处理器的数目;根据所述分割向在所述数据组块中的不同数据组块中的所述多个层中的不同层指派所述多个处理器中的每个处理器,从而所述多个处理器中的每个处理器忙碌、并且所述数据组块中的每个数据组块在数目等同于所述多个层的数目的所述时间步骤内被完全处理;以及设计从所述多个并行处理器的所述集合在所述时间步骤之一的所述索引到所述多个并行处理器的所述集合在后继时间步骤的所述索引的转换函数,其中所述转换函数与所述指派相一致。
【技术特征摘要】
【国外来华专利技术】2012.01.30 US 13/361,5441.一种用于在多个初始化步骤之后充分利用多个并行处理器的集合、以在计算环境中由处理器设备对数据组块序列执行任务的方法,其中所述数据组块中的每个数据组块在若干时间步骤中且被多个层处理,所述多个层在所述时间步骤中的每个时间步骤被多个并行处理器中的至少一个处理器处置,所述方法包括:将所述多个并行处理器的所述集合根据所述多个并行处理器的所述集合的索引分割成不相交子集,从而所述不相交子集中的每个不相交子集的大小对应于被指派为在所述多个层之一处理所述数据组块的多个并行处理器的数目;将待执行的任务分割成多个层;根据所述待执行的任务的分割将所述多个并行处理器中的每个处理器分配给所述待执行的任务的多个层,从而所述多个并行处理器中的每个处理器忙碌、并且所述数据组块中的每个数据组块在数目等同于所述多个层的数目的所述时间步骤内被完全处理,其中所述多个并行处理器中被指派为在所述多个层之一处理所述数据组块的所述数目小于所述多个并行处理器中被指派为在所述多个层的先前层处理所述数据组块的处理器的数目;在与分配给所述待执行任务的多个层的数目相等的时间步骤内处理数据组块;以及设计从所述多个并行处理器的所述集合在所述时间步骤之一的所述索引到所述多个并行处理器的所述集合在后继时间步骤的所述索引的转换函数,其中所述转换函数与所述指派相一致;其中所述转换函数受到如下约束:限制所述多个并行处理器的任一个总是对相同层工作;或者对于除了最低层之外的每层,限制所述多个并行处理器的任一个总是对与在先前层中相同的数据组块一起工作。2.根据权利要求1所述的方法,其中所述约束包括将在所述时间步骤中的每个时间步骤的所述多个并行处理器中的至少一个处理器限制于所述多个层中被指派为处理所述数据组块的相同层。3.根据权利要求1所述的方法,其中所述多个约束包括将所述多个并行处理器中被指派为在所述多个层中并非第一层的层处理所述数据组块的处理器集合限制为所述多个并行处理器的所述集合中被指派为在所述多个层中的先前层处理所述数据组块的子集。4.根据权利要求1所述的方法,其中所述多个并行处理器中可用的处理器的数目是n=2d-1,其中d是所述多个层的数目,所述多个并行处理器中向级0指派的处理器的数目是n=2d-1,并且所述多个并行处理器中被指派为在所述多个层中并非第一层的一层处理所述数据组块的处理器的数目是所述多个并行处理器中被指派为在所述多个层中的所述先前层处理所述数据组块的处理器的数目的一半。5.根据权利要求1所述的方法,其中所述多个并行处理器是按整数0至2n-2的编索引集合,对于i=0,1,…,d-1,所述多个并行处理器中被指派为在被编索引为i的所述多个层之一处理所述数据组块的处理器的数目是n/2i,并且n/2i个所述多个并行处理器的所述索引是具有以0跟踪有i个1为结束的、长度为d+1的标准二进制表示的n/2i个编号。6.根据权利要求1所述的方法,其中所述多个并行处理器是按整数0至2n-1的编索引集合,对于i=0,1,…,d-1,所述多个并行处理器中被指派为在被编索引为i的所述多个层之一处理所述数据组块的处理器的数目是n/2i,并且n/2i个所述多个并行处理器的所述索引是具有以1跟踪有i个0为结束的、长度为d+1的标准二进制表示的n/2i个编号。7.根据权利要求1所述的方法,还包括与所述设计结合将所述转换函数选择为将向左移位至少一位的循环移位应用于所述多个并行处理器的所述索引的标准二进...
【专利技术属性】
技术研发人员:M·赫希,S·T·克莱因,Y·托夫,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。