并行相联处理器系统技术方案

技术编号:2892871 阅读:183 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了处理器并行计算系统和字长串行SIMD处理器并行体系,从而能以一种适于在空气冷却环境下用芯片实现的简化体系实施并行阵列处理。本发明专利技术中提供的阵列是由字长宽度的处理单元构成的维阵列,其中的每个处理单元都装有适当容量的字长存贮器和控制电路。包含几个个处理单元的阵列的可分离的一部分可以被包含在一块芯片上,处理阵列中的单元最好由处理单元与一个局部存贮器组合而成。(*该技术在2011年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】总体上讲,本专利技术涉及多处理器并行运算系统,更具体地说,涉及一种字节串行SIMD处理器并行结构以及通过一种适合于在空气冷却的环境下进行芯片实施的简化结构进行并行阵列处理的系统和方法。1970年10月27日批准的授予R.A.斯多克(Stokes)等人的第3,537,074号美国专利中描述了一种阵列计算机,它包括多个并行处理器,一个单一的可编程控制单元,用于存贮配对物矢量的寄存器,掩蔽寄存器,以及对一个或多个控制单元指令构成的序列作出响应而对当前在矢量寄存器中的数据进行运算的装置。在整个七十年代,斯多克专利技术的并列处理器被称之谓“SIMD(单指令多数据)”处理器。这些装置也可以被认为是一个可编程控制单元驱动由几个并行处理器构成的一个阵列,其中每个处理器都具备存贮部分、算术单元、程序译码部分以及输入/输出部分。这些系统是一些大“盒子”,有时候与主计算机相联。SIMD与更普遍的处理器的一个重要区别在于在这种系统中的所有SIMD处理器在其对应的处理器中都可以有一套不同的数据,同时所有的处理器又由一个共同的控制器加以管理。SIMD计算机与一般的凡·纽曼(VonNeumann)处理器也有不同之处,即每条指令对一个数据矢量而不是对一个单独的操作数进行运算。最常见的多处理器系统是“多指令多数据系统”,其中每个处理器都可以对一组单独的数据执行一个单独的程序。一个MIMD(多指令多数据)系统中的处理器既可以执行不同的任务,也可以执行一个共同的主任务中的不同子任务。当人们在研制SIMD并行处理器时,人们发现正象授予罗尔(Lorie)等人的名为“SIMD矢量处理器中条件转移的执行方法”的第4,435,758号美国专利中所述的那样,当系统要执行的各任务之间高度独立且不争用信息时,SIMD并行处理器是非常合适的;但如果各任务之间争用信息时,则可以指示出一种在SIMD状态下工作的同步处理器网络。实际上,第4,435,758号美国专利中描述了这个问题,并且还讲述了他们为了提供条件转移的执行而不得不对1978年7月18日授于R.A.斯多克斯(Stokes)等人的第4,101,960号美国专利所作的改进。人们已习惯上把最高级的SIMD机描述为设置成一个N×N矩阵的同步位串行处理器,正象H·李(Li)和M·马莱斯卡(Maresca)在“国际并行处理大会会刊(Proceedings of the International Confercnce on Parallel Processing)”中第411至414页的一篇题为“多环网络(Polymorphic-Torus Network)”的论文中描述的示例性的多处理系统那样1989年8月3A号的IBM技术手册第32卷中详细描述了用于提高稀疏矩阵与矢量的相乘执行速度的、适用于H·李等人描述的通过一个网孔布局和一个被另一个用于重布目的的交换网络所覆盖的网状网络而物理地连接的大规模并行结构的矩阵矢量的相乘方法。有一本1990年度的出版物显示,人们曾想制造能通过多个处理器行进行运算的SIMD和SIMD/MIMD机器,其中某一行中的所有处理器执行完全相同的指令,但各行中的程序是完全不同的。从1990年1月号IBM技术手册第32卷8B中H·李、B·多姆(Dom)及R·杰夫(Jaffe)等人的示例中即可看到一个具有这种结构的一个体系,叫做并行本地运算器(PLOE),用于执行具体的竞争存贮器检查功能。本申请中设想建立一种可用现有技术实现的空气冷却系统,它对上面建立的体系中的芯片组进行工作。如果对现有技术作一番后见之明的研究,可以发现也有其他人描述了具有一个用于静态指令的ROM和用于在一块单独的硅片上存贮和访问数据的处理器的使用,1990年7月17日授予G·哈爱特(Hyatt)的名为“单片集成电路计算机结构”的第4,942,516号美国专利就是一例,但是这类处理器与SIMD类型的复杂应用无关。另外,还有人描述了不少用于执行不同任务的装置,我们的系统可能涉及它们。比方说,矩阵相乘可以并行,这是公知的。也有一些出版物涉及到可能使用我们的系统的、属于人工智能方面的应用。内容可寻址存贮器(见图3)或者关联存贮器可以使用各种处理芯片在很高的水平上被寻址。另外,申请人还发现,在某些情况下,用行逻辑电路根据前面的检索操作进行选择是非常有用的。参看“用于人工智能的VLSI”一书,编辑者Jose G.Delgado-Frias和Will R.Moore,Kluwer科学出版社,1989,第95-108页;以及Peter Kogge,Mark Brule及CharlesStormon著的讨论应用的“VLSL与基于规则的系统”一书。但是,也有其他人的一些巧妙的建议似乎要把发展方向引向不同于我们所遵循的方向。其中一例是由Bob Cushman主编的一本名为“用大量并行实行矩阵压碾(Matrix Crunching With Massive Parallelism)”的著作中的“VLSI系统设计”,1988年12月,第18-28页中描述的用于大量并行的牛津“智能存贮器”。也有人把并行处理试用于VLSI相关存贮器,试图描述一种适用于建立一种可重配置的完全并行相关的处理方案的VLSI相关存贮器芯片。这个方案认为使用传统的相关存贮器结构的话,为了进行数据转移,还需要一定数量的输出点(Pinout)。请参见报告“VLSI关联存贮器的并行处理”,作者S·亨根(Hengen)和I·斯切森(Scherson),该报告由NSF奖#ECS-h404627加以支持,由加利福尼亚大学(Santa Barbara,CA93106)电气与计算机工程系工作的作者加以报道。我们面对的问题是需要制造结构紧凑且又有多种应用的处理器。在实施这个总目标时,我们发现以前的设计局限于每个处理单元最高几位比特的存贮器以及每个电子芯片上装几个处理单元的比特串行方法,这是不适当的。结果,我们想到要设计一种结构,它可以以极高的密度制造,并适合于空气冷却环境,同时能被封装在轻而小的单元中。最后,我们找到了解决方案,产生了一个N维字长宽度处理单元阵列,阵列中的每个单元与字长宽度存贮器中适当的段和控制逻辑相连。含有多个处理单元的阵列的一个可分离的部分装在一个硅片中。这在下面将加以详述。我们自己的解决方案也产生为提高系统性能而必须解决的附加问题,另外我们还专利技术了一些进一步开发我们提出的系统的一些方案,其中的一些方案允许处理单元进行独立操作。在回顾先有技术时,我们注意到欧洲专利申请EP-A-208,457,该申请讲述了一种处理器阵列,其中,阵列中的每个处理器单元能够选择从中取得输入的单元。杰姆斯L.泰勒(Jame L.Taylor)于1990年5月4日递交的07/519,332号美国未决申请以及1988年9月27日递交的07/250,595号美国专利申请题为“SIMD阵列处理器”,其中描述了一个多维处理器阵列,该阵列在使并行处理的潜力被更好地开发而又不增加MIMD处理器的开销及复杂性方面具有更高的灵活性。该专利申请最初于1989年5月3日以欧洲申请EPO#88/307885/88-A的形式被公开,其中描述的系统沿着各个并行处理单元中与控制逻辑相连本文档来自技高网...

【技术保护点】
一种并行处理系统,其特征在于:多个阵元单元,每个阵元单元都有一位并行处理单元与一个局部存贮器进行组合,上述的局部存贮器与用于在所有的阵元单元中与相联方式对信息进行并行处理的处理单元相连,其中每个阵元单元适合于执行一个单元的相联处理。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:詹姆斯沃伦狄凡德佛彼得米歇尔考吉保罗安巴威尔金森尼古拉斯杰罗姆
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1