低延迟的基于RDMA的分布式存储装置制造方法及图纸

技术编号:18580455 阅读:26 留言:0更新日期:2018-08-01 14:46
“分布式存储控制器”应用基于RDMA的存储器分配器,以在跨多个联网计算机分布的共享存储器中实现分布式线程安全且无锁的存储系统。分布式存储控制器使得在任意数目的联网计算机上的任意数目的客户端应用、进程、子例程等能够经由单向RDMA消息序列(例如,RDMA读、RDMA写和RDMA原子比较和交换(CAS)操作)在共享存储器上并发执行自我指向的无锁分配、解分配、读、写等,而不需要CPU锁定。因此,托管共享存储器的计算设备的CPU不需要被通知在该共享存储器上的基于RDMA的读、写或CAS操作。因此,托管共享存储器的任意部分的计算设备的CPU利用率是最小的,由此使分布式存储控制器能够通过非常大量的联网计算设备来缩放到非常大量的并发访问。

Low latency distributed storage device based on RDMA

The \distributed storage controller\ is based on RDMA - based memory allocator to implement a distributed thread - safe and unlocked storage system in shared memory across multiple network computers. The distributed storage controller enables any number of client applications, processes, subroutines on any number of networked computers to perform self directed self directed allocation, distribution, distribution, and distribution on shared memory via a one-way RDMA message sequence, such as RDMA read, RDMA write, and RDMA atom comparison and switching (CAS) operations. Read, write, and so on, without the need for CPU lock. Therefore, the CPU of the computing device hosting the shared memory does not need to be notified of RDMA-based read, write, or CAS operations on the shared memory. Therefore, the CPU utilization rate of any part of the managed shared memory is minimal, thereby enabling the distributed storage controller to be able to scale to a very large number of concurrent access through a very large number of networking computing devices.

【技术实现步骤摘要】
【国外来华专利技术】低延迟的基于RDMA的分布式存储装置
技术介绍
通常,直接存储器存取(DMA)提供各种技术,其使得本地主机计算设备的设备或过程能够在不中断主机的CPU的情况下直接读和写该主机设备的本地存储器。相反,越来越多地部署在数据中心中的远程直接存储器访问(RDMA)扩展了传统的基于DMA的技术,以使远程设备或过程能够在不中断远程计算设备的CPU的情况下直接读和写远程计算设备的存储器。现有的基于RDMA的技术,诸如例如InfiniBand、iWARP、融合以太网(RoCE)上的RDMA等等,都使用支持RDMA的网络接口控制器(NIC)。
技术实现思路
提供以下
技术实现思路
以简化形式介绍将在以下具体实施方式中进一步描述的一些概念。本
技术实现思路
并非旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用作确定所要求保护的主题的范围的辅助手段。此外,虽然本文可能讨论其他技术的某些缺点,但所要求保护的主题不旨在限于可解决或解这些其他技术的任意或全部缺点的实现。本
技术实现思路
的唯一目的是以简化的形式呈现所要求保护的主题的一些概念,作为以下呈现的更详细描述的序言。如本文所述的“分布式存储控制器”在跨多个联网计算机分本文档来自技高网...

【技术保护点】
1.一种分布式存储系统,包括:多个联网计算设备,经由支持RDMA的NIC进行通信;分布式存储分布表和元数据,被托管在所述联网计算设备中的一个或多个联网计算设备上;分布式存储装置,包括跨所述联网计算设备中的两个或更多个联网计算设备分配的多个存储器区域;基于RDMA的消息传送模块的分离实例,被托管在多个所述联网计算设备中的每一个联网计算设备上;基于RDMA的存储器分配器模块的分离实例,被托管在多个所述联网计算设备中的每一个联网计算设备上;以及与所述分布表和元数据组合地应用所述计算设备中的一个或多个计算设备的所述基于RDMA的存储器分配器模块和所述计算设备中的一个或多个计算设备的所述基于RDMA的消...

【技术特征摘要】
【国外来华专利技术】2015.11.20 US 14/947,4731.一种分布式存储系统,包括:多个联网计算设备,经由支持RDMA的NIC进行通信;分布式存储分布表和元数据,被托管在所述联网计算设备中的一个或多个联网计算设备上;分布式存储装置,包括跨所述联网计算设备中的两个或更多个联网计算设备分配的多个存储器区域;基于RDMA的消息传送模块的分离实例,被托管在多个所述联网计算设备中的每一个联网计算设备上;基于RDMA的存储器分配器模块的分离实例,被托管在多个所述联网计算设备中的每一个联网计算设备上;以及与所述分布表和元数据组合地应用所述计算设备中的一个或多个计算设备的所述基于RDMA的存储器分配器模块和所述计算设备中的一个或多个计算设备的所述基于RDMA的消息传送模块,以并发地对所述分布式存储装置执行基于RDMA的无锁存储器操作的任意组合。2.根据权利要求1所述的系统,其中所述无锁存储器操作还包括在所述分布式存储装置上的无锁存储器分配、无锁存储器解分配、无锁存储器读和无锁存储器写的任意组合。3.根据权利要求2所述的系统,其中所述无锁存储器分配还包括:应用所述基于RDMA的存储器分配器模块的实例,以经由RDMA消息序列在所述联网计算设备中的一个或多个联网计算设备上分配所述存储器区域中的一个或多个存储器区域;应用所述基于RDMA的存储器分配器模块的实例,以经由RDMA消息序列从所述存储器区域中的一个或多个存储器区域中分配一个或多个存储器块;以及应用所述基于RDMA的存储器分配器模块的实例,以经由RDMA消息序列从所述存储器块中的一个或多个存储器块中分配一个或多个存储器段。4.根据权利要求3所述的系统,其中每个分配的存储器区域还包括元数据部分,所述元数据部分包括块头部和空闲段图。5.根据权利要求3所述的系统,其中每个存储器段还包括段元数据部分,所述段元数据部分包括从在所述存储器段的多个存储器元素中保存的数据所计算的段校验和值。6.根据权利要求2所述的系统,其中所述无锁存储器写进一步包括:通过执行基于RDMA的CAS操作以翻转存储器预留位图中的对应条目的位,预留从对应的存储器区域中分配的特定存储器段;以及对所预留的所述存储器段执行基于RDMA的写。7.根据权利要求2所述的系统,其中所述无锁存储器读还包括对特定存储器区域的特定存储器段执行基于RDMA的读操作。8.根据权利要求1所述的系统,还包括:协处理器模块的分离实例,被托管在所述联网计算设备中的一个或多个上;所述协处理器模块经由所述基于RDMA的存储器分配器模块的实例以及所述基于RDMA的消息传送模块的实例来为任意客户端应用提供到所述分布式存储装置的接口。9.一种计算机实现的过程,包括:共享存储器,包括在经由支持RDMA的NIC进行通信的两个或更多个联网计算设备上分配的多个存储器区域;每个存储器区域由在所述联网计算设备中的一个或多个联网计算设备上托管的基于RDMA的存储器分配器模块的实例分配;一个或多个存储器块,由在所述联网计算设备中的一个或多个联网计算设备上托管的所述基于RDMA的存储器分配器模块的实例从每个存储器区域分配;一个或多个存储器段,由在所述联网计算设...

【专利技术属性】
技术研发人员:A·沙米斯铃江丰K·M·里斯维克
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1