用于可扩展多租户RDMA流量的基于类的排队制造技术

技术编号:38707803 阅读:8 留言:0更新日期:2023-09-08 14:48
描述了用于数据联网的技术和装置。在一个示例中,一种对远程直接存储器访问(RDMA)分组进行排队的方法包括接收具有第一服务质量(QoS)数据字段的第一RDMA分组;基于第一QoS数据字段的值,将第一RDMA分组排入多个队列中的第一队列;接收具有第二QoS数据字段的第二RDMA分组;基于第二QoS数据字段的值,将第二RDMA分组排入所述多个队列中的第二队列,第二队列与第一队列不同。队列与第一队列不同。队列与第一队列不同。

【技术实现步骤摘要】
【国外来华专利技术】用于可扩展多租户RDMA流量的基于类的排队
[0001]相关申请的交叉引用
[0002]本申请要求于2020年12月30日提交的标题为“CLOUD SCALE MULTI

TENANCY FOR RDMA OVER CONVERGED ETHERNET(RoCE)”的第63/132,417号美国临时申请、于2021年2月2日提交的标题为“CLOUD SCALE MULTI

TENANCY FOR RDMA OVER CONVERGED ETHERNET(RoCE)”的第17/165,877号美国非临时申请,以及于2021年2月3日提交的标题为“CLASS

BASED QUEUEING FOR SCALABLE MULTI

TENANT RDMA TRAFFIC”的第17/166,922号美国非临时申请的优先权,所述申请出于所有目的通过引用整体并入本文。

技术介绍

[0003]融合以太网上的RDMA(RoCE)是允许通过无损以太网网络进行远程直接存储器访问(RDMA)的网络协议。RoCE通过在以太网上封装InfiniBand(IB)传输分组来实现这一点。通常,RoCE涉及具有专用RDMA队列和专用VLAN的层2网络。但是,层2网络无法扩展且性能不佳,因为它们缺乏更具可扩展性和高性能的层3网络中存在的关键特性和特点。因此,现有的公共云实施方式无法使用RoCE协议提供数据传送。

技术实现思路

[0004]本公开一般而言涉及数据联网。更具体地,描述了使层2流量能够使用层3协议在层3网络上传送的技术。在某些实施例中,本文描述的技术使远程直接存储器访问(RDMA)流量(例如,融合以太网上的RDMA(RoCE)流量)能够通过共享的层3物理网络或使用层3路由协议的交换机架构从多租户主机机器(即,托管属于不同租户或客户的计算实例的主机机器)上的计算实例传送到另一个多租户主机机器上的计算实例。这种通信也可以可选地包括其它流量(例如,TCP和/或UDP流量)。客户或租户体验到通信发生在专用的层2网络上,而通信实际上发生在使用层3路由协议的共享(即,在多个客户或租户之间共享)层3网络上。本文描述了各种实施例,包括方法、系统、存储可由一个或多个处理器执行的程序、代码或指令的非暂态计算机可读存储介质等。
[0005]在某些实施例中,一种数据联网的方法包括由联网设备接收具有第一服务质量(QoS)数据字段的第一RDMA分组;基于第一QoS数据字段的值,将第一RDMA分组排入多个队列中的第一队列;由联网设备接收具有第二QoS数据字段的第二RDMA分组;以及基于第二QoS数据字段的值,将第二RDMA分组排入多个队列中的第二队列,第二队列与第一队列不同。该方法还可以包括在多个队列之中根据第一权重从第一队列检索第一RDMA分组,并从第二队列检索第二RDMA分组。第一权重可以是加权循环方案。附加地或可替代地,多个队列可以包括控制队列,并且该方法还可以包括由联网设备从控制队列中检索多个控制分组,其中检索多个控制分组比检索第一RDMA分组和检索第二RDMA分组具有严格的优先级。在这种情况下,多个队列可以包括多个RDMA队列,其包括第一队列和第二队列,并且控制队列可以被配置为具有比多个RDMA队列中的任何队列低的带宽。多个控制分组可以包括网络控制协议分组或拥塞通知分组中的至少一个。
[0006]在如上所述的方法中,第一QoS数据字段可以是第一RDMA分组的互联网协议(IP)报头的差分服务代码点(DSCP)数据字段。第一和第二RDMA分组中的每一个可以是RoCEv2分组;可替代地,第一和第二RDMA分组中的每一个可以是根据覆盖封装协议(例如,VxLAN、NVGRE、GENEVE、STT和MPLS之中的一种)格式化的层3封装的分组,并且该方法还可以包括解封装第一RDMA分组以获得第一解封装的RDMA分组,以及将拥塞指示信息从第一RDMA分组的至少一个外部报头复制到第一解封装的RDMA分组。上述任一种方法还可以包括接收多个RDMA分组,多个RDMA分组中的每一个具有对应的QoS数据字段;对于多个RDMA分组中的每一个,基于RDMA分组的QoS数据字段的值将RDMA分组排入多个队列中的队列;从多个队列中检索多个RDMA分组,其中多个RDMA分组包括多个分组流,并且其中该方法还包括根据每流等价多路径方案路由多个分组流。
[0007]在又一些实施例中,描述了用于RDMA流量的基于类的排队的技术(例如,在层3网络中),其可以被用于在云规模的网络架构中维持基于类的分离,使得特定队列中的RDMA流量不会影响其它队列中的RDMA流量。根据某些实施例,系统可以被实现为包括用于传输不同类和来自不同租户的RDMA流量的共享架构,其中从一个RDMA网络接口控制器(NIC)到另一个NIC的跨越共享架构的路径中的每个设备包括专用于不同类的RDMA流量的多个队列。
[0008]根据某些实施例,一种对RDMA分组进行排队的方法包括由联网设备接收多个RDMA分组。多个RDMA分组中的每个RDMA分组包括服务质量(QoS)数据字段,并且对于多个RDMA分组中的每个RDMA分组,QoS数据字段具有指示服务的类的QoS值RDMA分组位于多个QoS值之中。该方法还包括由联网设备在多个RDMA队列之间分发多个RDMA分组。根据多个QoS值到多个RDMA队列的第一映射来执行分发。这种方法还包括由联网设备在多个RDMA队列之中根据第一权重从多个RDMA队列中检索多个RDMA分组。检索到的多个RDMA分组可以包括多个分组流,在这种情况下,示例还可以包括根据每流等价多路径方案来路由检索到的多个RDMA分组的多个分组流。多个RDMA分组中的每个RDMA分组可以是RoCEv2分组,或者多个RDMA分组中的每个RDMA分组可以是根据覆盖封装协议(例如,VxLAN、NVGRE、GENEVE、STT或MPLS)格式化的层3封装分组。
[0009]在进一步的示例中,分发包括响应于确定多个RDMA分组中的第一RDMA分组的QoS数据字段具有第一QoS值而将第一RDMA分组存储到多个RDMA队列中的第一RDMA队列;以及,响应于确定多个RDMA分组中的第二RDMA分组的QoS数据字段具有第二QoS值而将第二RDMA分组存储到多个RDMA队列中的第二RDMA队列,其中第二QoS值与第一QoS值不同。
[0010]根据某些实施例,另一种对RDMA分组进行排队的方法还包括由联网设备从控制队列中检索多个控制分组,其中检索多个控制分组比检索多个RDMA分组具有严格的优先级。在这种情况下,控制队列可以被配置为具有比多个RDMA队列中的任何一个更低的带宽。可替代地或附加地,多个控制分组可以包括至少一个网络控制协议分组(例如,BGP分组)和/或至少一个拥塞通知分组(CNP分组)。
[0011]根据某些实施例,联网设备(例如,叶交换机或主干交换机)可以被配置为包括多个RDMA队列,并且处理电路系统耦合到多个RDMA队列并且被配置为接收多个RDM本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种对远程直接存储器访问(RDMA)分组进行排队的方法,所述方法包括:由联网设备接收具有第一服务质量(QoS)数据字段的第一RDMA分组;基于第一QoS数据字段的值,将第一RDMA分组排入多个队列中的第一队列;由联网设备接收具有第二QoS数据字段的第二RDMA分组;以及基于第二QoS数据字段的值,将第二RDMA分组排入所述多个队列中的第二队列,第二队列与第一队列不同。2.如权利要求1所述的方法,所述方法还包括根据所述多个队列中的第一权重从第一队列检索第一RDMA分组,以及从第二队列检索第二RDMA分组。3.如权利要求1所述的方法,所述方法还包括根据加权循环方案从第一队列检索第一RDMA分组,以及从第二队列检索第二RDMA分组。4.如权利要求1所述的方法,其中所述多个队列包括控制队列,并且其中所述方法还包括由联网设备从控制队列检索多个控制分组,其中检索所述多个控制分组比检索第一RDMA分组和检索第二RDMA分组具有严格的优先级。5.如权利要求4所述的方法,其中所述多个队列包括多个RDMA队列,所述多个RDMA队列包括第一队列和第二队列,以及其中控制队列被配置为具有比所述多个RDMA队列中的任何一个RDMA队列更低的带宽。6.如权利要求4所述的方法,其中所述多个控制分组包括网络控制协议分组或拥塞通知分组中的至少一个。7.如权利要求1至6中的任一项所述的方法,其中第一QoS数据字段是第一RDMA分组的互联网协议(IP)报头的差分服务代码点(DSCP)数据字段。8.如权利要求1至6中的任一项所述的方法,其中第一RDMA分组和第二RDMA分组中的每一个都是RoCEv2分组。9.如权利要求1至6中的任一项所述的方法,其中第一RDMA分组和第二RDMA分组中的每一个都是根据覆盖封装协议格式化的层3封装的分组。10.如权利要求9所述的方法,其中覆盖封装协议是VxLAN、NVGRE、GENEVE、STT和MPLS之一。11.如权利要求9所述的方法,其中所述方法还包括:解封装第一RDMA分组以获得第一解封装的RDMA分组,以及将拥塞指示信息从第一RDMA分组的至少一个外部报头复制到第一解封装的RDMA分组。12.如权利要求1所述的方法,其中所述方法还包括:接收多个RDMA分组,所述多个RDMA分组中的每个RDMA分组具有对应的QoS数据字段;对于所述多个RDMA分组中的每个RDMA分组,基于该RDMA分组的QoS数据字段的值将该RDMA分组排入所述多个队列中的队列;以及从所述多个队列检索所述多个RDMA分组,其中所述多个RDMA分组包括多个分组流,并且其中所述方法还包括根据每流等价多路径方案来路由所述多个分组流。13....

【专利技术属性】
技术研发人员:S
申请(专利权)人:甲骨文国际公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1