超级计算机中通过动态重新划分的容错制造技术

技术编号:3334219 阅读:234 留言:0更新日期:2012-04-11 18:40
通过提供额外冗余备用处理器组和通过设计系统使得这些额外的处理器组可以与发生硬件故障的任何组交换而使多处理器并行计算机容忍硬件故障。这一交换可以在软件控制下进行,从而允许整个计算机承受硬件故障,但是在备用处理器交换后,对软件来说仍然象是一个原来的、全部起作用的系统。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术一般涉及在并行计算机互联网络中通过软件控制的动态重新划分提供容错。
技术介绍
巨大类的重要计算可以由巨型并行计算机系统执行。这种系统包括许多同样的计算节点,每一个这样的节点通常包括一个或者多个CPU、存储器、和一个或者多个网络接口来连接它与其它节点。在于2001年2月24日递交的、名为“Massively ParallelSupercomputer”的相关美国临时专利申请60/271,124中说明的计算机使用芯片上系统(SOC)技术来建立具有高吞吐量的可升级的合算的计算系统。SOC技术已经使其适于使用嵌入部件库在单个芯片上建立整个多处理器节点,包括具有集成的一级超高速缓冲存储器的CPU内核。这种封装技术极大地减少了一个节点的部件数目,允许建立可靠的大型机器。专利技术概述本专利技术通过动态重新划分提供在超级计算机中的容错。通过提供另外几组冗余备用处理器和通过设计系统使得这些额外的处理器组可以与发生硬件故障的任何组交换,使多处理器并行计算机容忍硬件故障备用处理器。这一交换可以在软件的控制下进行,从而允许整个计算机承受硬件故障,但是在与备用处理器交换后对软件仍然象是一个原来的本文档来自技高网...

【技术保护点】
一种用于在包括多个并行处理器的并行计算机系统中提供容错的方法,以使该计算机系统容忍硬件故障,包括:给该计算机系统提供额外的冗余备用处理器组;设计该计算机系统,使得可以切换该冗余备用处理器组以取代经历硬件故障的计算机系统的处理 器组运行。

【技术特征摘要】
US 2001-2-24 60/271,1241.一种用于在包括多个并行处理器的并行计算机系统中提供容错的方法,以使该计算机系统容忍硬件故障,包括给该计算机系统提供额外的冗余备用处理器组;设计该计算机系统,使得可以切换该冗余备用处理器组以取代经历硬件故障的计算机系统的处理器组运行。2.如权利要求1的方法,其特征在于所述切换在软件控制下执行,从而允许整个计算机系统承受硬件故障,并且在切换到备用处理器组后该计算机系统对于软件来说看上去像完全起作用和运行着的计算机系统。3.如权利要求1的方法,其特征在于所述计算机系统包括一个巨型并行计算机系统,它包括多个基本相同的计算节点,每一计算节点包括一个或者多个CPU、存储器、和一个或者多个连接它与其它计算节点的网络接口。4.如权利要求1的方法,其特征在于所述计算机系统包括一个a×b×c计算节点的阵列,其被连接为为3维环型,其中,每一计算节点由在+和-x、y、z方向的6个链接,包括覆盖链接,连接到6个相邻的计算节点。5.如权利要求4的方法,其特征在于每一计算节点包括带有一个多处理器的ASIC,其中一个处理器作为巨型并行超级计算机的一部分执行处理,和...

【专利技术属性】
技术研发人员:陈东保罗W科特尤斯艾伦G加拉托德E塔肯
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1