当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于高性能结构内的QoS的方法、装置和系统制造方法及图纸

技术编号:13506416 阅读:69 留言:0更新日期:2016-08-10 14:41
用于在高性能结构内实现服务质量(QoS)的方法、装置和系统。实现多层级QoS方案,所述多层级QoS方案包括虚拟结构、通信量类别、服务等级(SL)、服务信道(SC)和虚拟通道(VL)。实现SL以用于层4(传输层)的对结构分组的端对端传送,而使用SC以在链路层处区分结构分组。将结构分组划分为微片,经由结构链路将结构分组数据作为微片流来传输。结构交换机输入端口和设备接收端口检测接收到的结构分组的SC ID,并且可实现SC至VL映射来确定用于在其中缓冲结构分组微片的VL缓冲器。SL可具有多个SC,并且可实现SC至SC映射,以便当通过所述结构转发结构分组时,改变所述结构分组的SC,同时维持所述结构分组的SL。通信量类别可包括多个SL,从而使得应用的请求和响应通信量可使用分开的SL。

【技术实现步骤摘要】
【国外来华专利技术】用于高性能结构内的QoS的方法、装置和系统
技术介绍
近年来,对高性能计算(HPC)的使用和兴趣已出现大幅增长。过去,HPC通常与所谓的“超级计算机”相关联。超级计算机在20世纪60年代被引入,最初以及几十年来主要由SeymourCray在以SeymourCray的名字或首字母缩写命名的控制数据公司(CDC)、Cray研究所以及随后的多个公司制造。虽然20世纪70年代的超级计算机仅使用几个处理器,但在20世纪90年代,具有数千个处理器的机器开始出现,并且近来已经实现具有数十万个“现成”的处理器的大规模并行超级计算机。存在许多类型的HPC架构,这些HPC架构以不同级别的规模和性能来实现并进行研究导向。然而,共同的思路在于,诸如处理器和/或处理器核之类的大量计算单元的互连来以并行的方式协作地执行任务。根据近来的芯片上系统(SoC)设计和提案,使用二维(2D)阵列、三维环(torus)、环或其他配置在单个SoC上实现大量的处理器核等。此外,研究人员已经提出了3DSoC,在3DsoC下,100个或甚至1000个处理器核以3D阵列互连。在多个服务器板上的多个分开的多核处理器和SoC也可以紧密地间隔,多个服务器板又经由背板等通信地互连。另一常见方法是互连在通常以2D阵列配置的服务器的机架(例如,刀片式服务器和模块)中的多个互连计算单元。IBMSequoia(红杉)(世界上最快的超级计算机之一)包括总计1572864个核的服务器刀片/模块的96个机架的2D阵列,并且当在峰值性能下操作时消耗巨额的7.9兆瓦。HPC的性能瓶颈之一是由在计算节点之间的多个互连上传送数据引起的等待时间(latency)。典型地,这些互连以互连层次结构来构造,处理器/SoC内的最高速且最短的互连在此层次结构的顶部,而等待时间随着沿层次结构级别向下而增加。例如,在处理器/SoC级别之后,互连层次结构可包括处理器间的互连级别、板间的互连级别、以及将单独的服务器或单独服务器的聚合与其他机架中的服务器/聚合连接的一个或多个附加的级别。互连层次结构的一个或多个级别采用不同的协议是常见的。例如,SoC内的多个互连典型地是专有的,而层次结构中的较低级别可采用专有或标准化的多个互连。不同的互连级别还将典型地实现不同的物理(PHY)层。作为结果,在多个互连级别之间采用某种类型的互连桥接是必要的。此外,当实现异构计算环境时,给定的互连级别内的桥接可能是必须的。在互连层次结构的较低级别处,使用诸如以太网(在各种IEEE802.3标准中定义)和无限带宽(InfiniBand)之类的标准化互连。在PHY层,这些标准中的每一种都支持有线连接(诸如,缆线和在背板上)以及光链路。以太网在OSI7层模型中的链路层(层2)上实现,并且从根本上被视为链路层协议。无限带宽(InfiniBand)标准定义了用于覆盖OSI层1-4的无限带宽的各个OSI层方面。现代高性能结构需要支持需要死锁避免技术的各种高级协议和拓扑。满足这些需要的常见方式是将通信量分离到多个虚拟通道(也称为虚拟信道)上,使得对每一个虚拟通道的基于信用的流控制可独立于其他虚拟通道。除了这些基板要求之外,越来越多地将结构用于多协议和多应用网络也正需要增加的灵活性、可配置性以及对通信量分离和服务质量(QoS)的控制。为了满足这些增加的需求,要求结构在它们的核处支持更大数量的虚拟通道,然而,结构的边缘处的设备或结构中的特定子系统可能不需要这么多虚拟通道或可能使用以对较少虚拟通道的支持而设计的硬件来实现,这暗示了虚拟通道的配置和利用在此区域的硬件能力方面必须准许异构结构。附图说明通过参考与附图一起进行的下面的详细描述,本专利技术的前述的方面和许多伴随的优点,将变得更加轻松地被理解,其中,在各个视图中,相同参考编号表示相同部件,除非另作说明:图1是示出根据一个实施例的包括结构(fabric)架构的各种部件和互连的系统的高级视图的示意图;图2是描绘根据一个实施例的用于在结构链路上传送数据的该架构的多个层的示意图;图3是示出被集合在捆包(bundle)中的多个微片(flit)的示意图;图4是示出根据一个实施例的结构分组(packet)的结构的示意图;图5是示出根据一个实施例的标准检测LTP的数据结构的示图;图6是示出根据一个实施例的14位CRCLTP的数据结构的示图;图7是示出根据一个实施例的增强型检测LTP的数据结构的示图;图8是示出根据一个实施例的标准检测空LTP的数据结构的示图;图9a是示出根据一个实施例的用于4通道链路的传输方案的实施例的示图,在此传输方案下,每次在链路结构与链路传送子层之间的接口处并行地处理两个用于标准检测LTP的微片;图9b是示出根据一个实施例的用于4通道链路的传输方案的实施例的示图,在此传输方案下,每次在链路结构与链路传送子层之间的接口处并行地处理两个用于增强型检测LTP的微片;图10是示出根据一个实施例的在4通道链路上传输具有两个控制位的14位CRCLTP的示意图,其中每次在链路结构与链路传送子层之间的接口处并行地处理两个微片;图11是示出根据一个实施例的在8通道数据路径上并行地传输具有两个控制位的两个14位CRCLTP的示意图,此8通道数据路径包括结合在一起的两个4通道链路;图12是示出根据一个实施例的在采用4通道的两个链路端口之间的双向数据传输的示例的示意图;图13是示出交织来自在分开的虚拟通道上发送的两个FP的多个结构分组微片的实施例的示例的示图;图14是示出根据一个实施例的使用进栈(Push)和出栈(Pop)交织的示图;图15是示出根据一个实施例的、使用进栈和出栈交织以及VL标记交织的组合的示图;图16是示出根据一个实施例的、来自缓存在三个分开的VLFIFO中的三个结构分组的多个微片的抢占式交织的示例的组合示意图和时间流图,三个分开的VLFIFO对应于具有单独优先级等级的VL;图17是示出根据一个实施例的、来自缓存在三个分开的VLFIFO中的三个结构分组的多个微片的冒泡式交织和抢占式交织的示例的组合示意图和时间流图,其中两个VL共享优先级等级,而另一个VL具有更高的优先级等级;图18a和18b是示出传输LTP传输方案和使用每通道(per-lane)的CRC和LTPCRC来检测LTP通道和错误通道的示意图,其中图18a描绘了根据一个实施例的LTP传输方案中的LTP的原始传输,而图18b描绘了根据一个实施例的使用重放缓冲器在LTP传输流中的LTP的重传;图18c是示出根据一个实施例的使用重试标记和往返标记来防止重放缓冲器LTP被覆写的示意图;图19是示出根据一个实施例的使用33个传送组(XFR)来传输标准检测LTP的示图;图20是示出根据一个实施例的使用33个32位XFR和四个LTP序列状态在4通道链路上传输LTP的示图;图21是示出根据一个实施例的如何使用33个32位XFR在4通道链路上传输包括8字节数据和第65位的微片数据的示图;图22a-22e共同构成多页流程图,这些流程图示出根据一个实施例的用于使用隐式的ACK以及重放缓冲器促进链路级别的可靠的LTP传输的操作和逻辑,并且还示出根据一个实施例的用于检测错误通道的操作和逻辑;图23a是根据一个实施例的发射机的状态图;图23b是根据一本文档来自技高网...

【技术保护点】
一种方法,包括以下步骤:实现多个服务等级(SL),以便在结构中的结构端点之间传送结构分组,所述结构包括耦合在多个结构设备的结构端口之间的多个结构链路;将一个或多个服务信道(SC)指派给每一个服务等级;在所述结构端口的至少部分中的每一个处,将SC指派给虚拟通道(VL);以及将每一个结构分组划分为多个微片,并且通过使用SC在所述结构链路上传送所述结构分组的微片来实施所述结构分组在结构端点之间的传送;其中,基于为了跨所述结构链路传送微片而实现的SC来确定用于缓冲将跨给定结构链路来传输的给定结构分组的微片的VL。

【技术特征摘要】
【国外来华专利技术】2013.12.24 US 14/139,9301.一种用于数据通信的方法,包括以下步骤:实现多个服务等级SL,以便在结构中的结构端点之间传送结构分组,所述结构包括耦合在多个结构设备的多个结构端口之间的多个结构链路;将一个或多个服务信道SC指派给每一个服务等级;在所述多个结构端口中的至少部分的每一个结构端口处,将SC指派给虚拟通道VL;以及将每一个结构分组划分为多个微片,并且通过使用SC在所述结构链路上传送所述结构分组的微片来实施所述结构分组在结构端点之间的传送;其中,基于为了在给定结构链路上传送给定结构分组的微片而实现的SC,来确定用于缓冲将在所述给定结构链路上传输的所述给定结构分组的微片的VL。2.如权利要求1所述的方法,其特征在于,在传输层中实现所述服务等级,并且在所述结构的链路层处实现所述服务信道。3.如权利要求1或2所述的方法,其特征在于,进一步包括以下步骤:实现多个通信量类别,其中,向每一个通信量类别指派一个或多个服务等级,并且将每一个通信量类别分配至给定传输层或在传输层处管理数据传送的应用,其中每个通信量类别表示给定的传输层或应用将使用的一组服务等级。4.如权利要求3所述的方法,其特征在于,进一步包括以下步骤:为通信量类别实现两个SL,其中,所述通信量类别的请求通信量指被派第一SL,并且所述通信量类别的响应通信量被指派第二SL。5.如权利要求4所述的方法,其特征在于,进一步包括以下步骤:实现多个虚拟结构v结构,其中,每一个v结构与通信量类别相关联,并且在所述结构中的所述结构端口的子集上实现至少一个v结构。6.如权利要求1或2所述的方法,其特征在于,结构分组包括服务信道标识符,并且通过所述结构分组的服务信道标识符来暗示为了跨所述结构传送所述结构分组而实现的SL。7.如权利要求1或2所述的方法,其特征在于,进一步包括以下步骤:在第一结构端点处,将第一SC指派给结构分组,所述结构分组将通过所述结构、并沿转发路径而传送至第二结构端点,所述转发路径包括多个结构链路且包括遍历至少一个结构交换机;采用所述第一SC,以便沿所述转发路径中包括至少一个结构链路的第一部分来转发所述结构分组的微片;在结构交换机处,将所述结构分组的SC从所述第一SC改变为第二SC;以及采用所述第二SC,以便沿所述转发路径中包括至少一个结构链路的第二部分来转发所述结构分组的微片。8.如权利要求1或2所述的方法,其特征在于,所述结构包括异构结构,所述异构结构包括支持不同数量VL的结构设备。9.如权利要求8所述的方法,其特征在于,将微片从实现第一数量VL的发射结构端口传输至实现第二数量VL的链路对等方的接收结构端口,所述第二数量VL少于所述第一数量VL,所述方法进一步包括以下步骤:执行VL收缩映射,在所述VL收缩映射下,将所述发射结构端口中的VL向下映射至所述接收结构端口中的VL。10.如权利要求8所述的方法,其特征在于,将微片从实现第一数量VL的发射结构端口传输至实现第二数量VL的链路对等方的接收结构端口,所述第二数量VL多于所述第一数量VL,所述方法进一步包括以下步骤:执行VL膨胀映射,在所述VL膨胀映射下,将所述发射结构端口中的VL向上映射至所述接收结构端口中的VL。11.如权利要求1或2所述的方法,其特征在于,进一步包括以下步骤:实现通信量优先级排定,其中,向SL指派优先级等级,并且与具有较高优先级等级的SL相关联的结构分组的微片的传输可抢先于与具有相对较低优先级的SL相关联的结构分组的微片的传输。12.如权利要求1或2所述的方法,其特征在于,进一步包括以下步骤:在源结构端点处,将第一SC指派给结构分组,所述结构分组通过所述结构、并沿转发路径而传送至目的地结构端点,所述转发路径包括多个结构链路;将所述第一SC的服务信道标识符存储在结构分组头部中;将所述结构分组划分为多个微片,所述多个微片包括头微片、多个体微片以及尾微片,其中,所述头微片中的数据包括所述服务信道标识符;在结构交换机处接收微片,并且检测所述头微片;检查结构分组的头微片以确定所述结构分组的头微片的服务信道标识符;以及采用SC至VL映射来确定选择哪个VL用于将所述结构分组的微片沿所述转发路径从所述结构交换机传输至下一跳。13.如权利要求12所述的方法,其特征在于,进一步包括以下步骤:采用SC至SC映射以将所述SC从所述第一SC改变为第二SC;以及以所述第二SC的服务信道标识符来替换所述头微片中的服务信道标识符;以及采用所述结构分组的当前SC来确定用于跨所述结构链路来传送所述结构分组的微片的VL缓冲器;并且其中,对于至少一个结构分组,使用至少两个不同的虚拟通道VL、并沿所述转发路径来转发所述结构分组的微片。14.一种用于数据通信的设备,所述设备包括:存储器,所述存储器包括发射缓冲器;结构发射端口;以及用于以下操作的装置:将所述发射缓冲器分割为多个发射虚拟通道VL缓冲器,并且将每一个发射VL缓冲器与由所述发射端口使用的相应的VL相关联;实现服务信道SC至发射VL映射,其中,将输入服务信道标识符映射至由所述发射端口使用的VL;接收与将离开所述结构发射端口而向外传输到结构链路上的结构分组相对应的结构分组数据;从接收到的结构分组数据中检索服务信道标识符;将服务信道标识符用作对SC至发射VL映射的输入,以便标识用于经由所述结构传输端口来传输所述结构分组数据的发射VL缓冲器;以及在经标识的发射VL缓冲器中缓冲结构分组数据。15.如权利要求14所述的设备,其特征在于,所述设备配置成实施针对结构分组在所述结构中的传输的服务质量QoS,所述QoS包括多个服务等级SL,其中,对至少一些SL排定优先级,并且SC具有隐含的SL,所述装置进一步包括:用于以下操作的装置:在VL之间仲裁;以及选择将从中拉出结构分组数据以便从所述发射端口传输的VL,其中,具有较高优先级的VL能够抢先于具有较低优先级的VL。16.如权利要求14或15所述的设备,其特征在于,进一步包括:存储器,所述存储器包...

【专利技术属性】
技术研发人员:T·M·里默T·D·罗维特A·S·程
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1