【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
近年来,对高性能计算(HPC)的使用和兴趣已出现大幅增长。过去,HPC通常与所谓的“超级计算机”相关联。超级计算机在20世纪60年代被引入,最初以及几十年来主要由SeymourCray在以SeymourCray的名字或首字母缩写命名的控制数据公司(CDC)、Cray研究所以及随后的多个公司制造。虽然20世纪70年代的超级计算机仅使用几个处理器,但在20世纪90年代,具有数千个处理器的机器开始出现,并且近来已经实现具有数十万个“现成”的处理器的大规模并行超级计算机。存在许多类型的HPC架构,这些HPC架构以不同级别的规模和性能来实现并进行研究导向。然而,共同的思路在于,诸如处理器和/或处理器核之类的大量计算单元的互连来以并行的方式协作地执行任务。根据近来的芯片上系统(SoC)设计和提案,使用二维(2D)阵列、三维环(torus)、环或其他配置在单个SoC上实现大量的处理器核等。此外,研究人员已经提出了3DSoC,在3DsoC下,100个或甚至1000个处理器核以3D阵列互连。在多个服务器板上的多个分开的多核处理器和SoC也可以紧密地间隔,多个服务器板又经由背板等通信地互连。另一常见方法是互连在通常以2D阵列配置的服务器的机架(例如,刀片式服务器和模块)中的多个互连计算单元。IBMSequoia(红杉)(宣称是世界上最快的超级计算机)包括总计1572864个核的服务器刀片/模块的96个机架的2D阵列,并且当在峰值性能下操作时消耗 ...
【技术保护点】
一种装置,所述装置包括:链路接口,所述链路接口包括:接收端口,所述接收端口包括多个接收通道,每一个接收通道配置成接收从链路接口对等方的发射端口并行地传输的多个位流中的相应位流;以及用于以下操作的电路和逻辑:当接收到所述多个位流时,处理所述多个位流,并且提取从所述链路接口对等方传输的包括链路分组的数据;检测接收到的坏链路分组;以及检测导致所述接收到的坏链路分组的错误接收通道。
【技术特征摘要】
【国外来华专利技术】2013.12.06 US 14/099,3451.一种装置,所述装置包括:
链路接口,所述链路接口包括:
接收端口,所述接收端口包括多个接收通道,每一个接收通道配置成接收从链路接口
对等方的发射端口并行地传输的多个位流中的相应位流;以及
用于以下操作的电路和逻辑:
当接收到所述多个位流时,处理所述多个位流,并且提取从所述链路接口对等方传输
的包括链路分组的数据;
检测接收到的坏链路分组;以及
检测导致所述接收到的坏链路分组的错误接收通道。
2.如权利要求1所述的装置,其特征在于,通过使用伴随每一个链路分组传输的所传输
数据完整性校验值来促进对接收到的坏链路分组的检测,并且其中,在每一个通道上传输
的位流不包括所传输的数据完整性校验值。
3.如权利要求1或2所述的装置,其特征在于,所述用于检测错误接收通道的电路和逻
辑包括用于以下操作的电路和逻辑:
针对每一个接收通道,对在对应于链路分组的第一传输的那个通道上接收到的数据计
算数据完整性校验值,所述链路分组的所述第一传输导致接收到的坏链路分组;
针对每一个接收通道,对在对应于所述链路分组的重传的那个通道上接收到的数据计
算数据完整性校验值;以及
在每一个通道的基础上,比较针对所述链路分组的所述第一传输与针对所述链路分组
的重传的数据完整性校验值,以便确定哪个接收通道是错误的。
4.如权利要求1所述的装置,其特征在于,使用序列来传输链路分组,在所述序列下,至
少一个接收通道结合接收到给定链路分组的数据而接收与至少一个其他接收通道不同量
的数据,并且其中,接收所述不同量的数据的一个或多个通道取决于当传输所述链路分组
时的所述序列的状态而改变。
5.如权利要求4所述的装置,其特征在于,在接收链路分组的数据期间,在给定通道上
接收到的位流数据包括传送组,所述传送组取决于当传输所述链路分组时所述序列的状
态,其中,用于检测错误接收通道的电路和逻辑包括用于以下操作的电路和逻辑:
针对每一个接收通道,对在对应于链路分组的第一传输的那个通道上接收到的包括第
一传送组的数据计算数据完整性校验值,所述链路分组的所述第一传输在第一序列状态下
传输且导致接收到的坏链路分组;
针对每一个接收通道,对在对应于所述链路分组的重传的那个通道上接收到的包括第
二传送组的数据计算数据完整性校验值,所述链路分组的所述重传在第二序列状态下传
输;以及
在每一个传输组的基础上,比较针对所述链路分组的所述第一传输与针对所述链路分
组的重传的数据完整性校验值,以便确定哪个接收通道是错误的。
6.如前述权利要求中的任一项所述的装置,其特征在于,进一步包括用于以下操作的
电路和逻辑:
从所述链路接口对等方接收指示正在重传或将重传对应于所述坏链路分组的链路分
组的指标;以及
采用所述指标来检测对所述经重传的链路分组的接收。
7.如前述权利要求所述的装置,其特征在于,进一步包括用于以下操作的电路和逻辑:
检测对坏链路分组序列的接收;以及
确定导致所述序列中的所述坏链路分组中的至少一个坏链路的接收通道是错误的。
8.如前述权利要求所述的装置,其特征在于,进一步包括发射端口,所述发射端口包括
多个发射通道且配置成经由多个位流来传输包括链路分组的数据,所述多个位流经由所述
多个发射通道被并行地传输至所述链路接口对等方的接收端口,并且其中,所述发射端口
包括用于响应于检测到坏链路分组而经由所述发射端口将重传请求发送至所述链路接口
对等方的电路和逻辑,所述重传请求包括配置成由所述链路接口对等方处理以标识所述坏
链路分组的指标。
9.如前述权利要求所述的装置,其特征在于,所述链路接口进一步包括发射端口,并且
所述链路接口对等方包括接收端口,并且所述链路接口和所述链路接口对等方配置成支持
链路上的双向通信,所述链路包括从发射端口到包含n个通道的接收端口的一对单向链路,
所述装置进一步包括用于以下操作的电路和逻辑:
标识错误接收通道;
执行链路接口侧操作以在降级的链路配置下重新初始化所述链路的操作,所述降级的
操作采用不包括所述错误通道的n-1个接收通道。
10.一种装置,所述装置包括:
链路接口,所述链路接口包括:
接收端口,所述接收端口包括多个接收通道,每一个接收通道配置成接收从链路接口
对等方的发射端口并行地传输的多个位流中的相应位流;以及
用于以下操作的电路和逻辑:
处理所述多个位流,并且提取从所述链路接口对等方传输的包括链路分组的数据;
对在针对所述链路分组的每一个接收通道上接收到的数据计算每通道的数据完整性
校验值;
检测针对链路分组的接收到的数据是坏的,并且响应于检测到针对链路分组的接收到
的数据是坏的:
存储针对所述坏链路分组的每通道的数据完整性校验值;
接收对应于所述坏链路分组的重传的链路分组;
对在针对所述重传的链路分组的每一个接收通道上接收到的数据重新计算每通道的
数据完整性校验值;以及
比较所存储的每通道的数据完整性校验值与重新计算的每通道的数据完整性校验值
以检测错误接收通道。
11.如权利要求10所述的装置,其特征在于,每一个链路分组包括在所述链路接口对等
方处计算出的所传输的循环冗余校验(CRC)值,所述装置进一步包括用于以下操作的电路
和逻辑:基于针对所述链路分组的接收到的数据来计算接收到的CRC值;以及将接收到的
CRC值与所传输的CRC值比较以确定所述链路分组是否是坏的。
12.如权利要求10或11所述的装置,其特征在于,使用序列来传输链路分组,在所述序
列下,至少一个接收通道结合接收到给定链路分组的数据而接收与至少一个其他接收通道
不同量的数据,并且其中,接收所述不同量的数据的一个或多个通道取决于当传输所述链
路分组时的所述序列的状态而改变。
13.如权利要求12所述的装置,其特征在于,在接收链路分组的数据期间,在给定通道
上接收到的位流数据包括传送组,所述传送组取决于当传输所述链路分组时所述序列的状
态,并且其中,当传输所述链路分组与重传所述链路分组时的所述序列的状态是不同的,所
述装...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。