当前位置: 首页 > 专利查询>英特尔公司专利>正文

远程存储器操作制造技术

技术编号:20084246 阅读:20 留言:0更新日期:2019-01-15 03:48
节点架构和代理请求的扩展使节点能够向远程节点暴露存储器计算能力。远程节点可以请求远程存储器计算资源执行操作,并且远程存储器计算资源可以本地地执行请求并返回计算的结果。该节点包括处理资源、结构接口和包括存储器计算资源的存储器子系统。存储器计算资源对请求的本地执行可以减少远程请求的典型延迟和带宽问题。

Remote Memory Operation

The extension of node architecture and proxy requests enables nodes to expose memory computing power to remote nodes. Remote nodes can request remote memory computing resources to perform operations, and remote memory computing resources can perform requests locally and return the results of calculations. The node includes processing resources, structure interfaces and memory subsystems including memory computing resources. Local execution of requests by memory computing resources can reduce typical latency and bandwidth problems of remote requests.

【技术实现步骤摘要】
【国外来华专利技术】远程存储器操作优先权本申请根据35U.S.C.§365(c)要求2016年7月1日提交的名为REMOTEMEMORYOPERATIONS的美国申请第15/201373号的优先权。本申请要求该申请的优先权的利益。
该描述一般涉及网络系统,并且更具体的描述涉及具有远程存储器操作能力的网络系统中的节点。版权声明/许可本专利文献的公开的部分可包含受版权保护的材料。版权所有者不反对任何人复制专利和商标局专利文件或记录中出现的专利文献或专利公开,但在其他方面保留各类所有版权。版权声明适用于以下所述以及随附的附图中的所有数据,以及下述任何软件:版权所有英特尔公司,保留所有权利。
技术介绍
计算领域已经增加了创建和使用数据的能力。相应地,创建了更多应用来生成和使用越来越多的数据。数据中心和服务器群现在很常见,其中许多处理节点在互连结构上并行运行。在这种环境中的许多操作涉及许多计算的运算,这些计算很好地适用于并行性。因此,工作负载可以并行地分布在许多节点上以进行计算。可以认为计算需要处理资源以及数据存储资源,尤其是对于数据量大的操作。共享处理资源使远程节点能够执行计算。共享存储器资源使远程节点能够存储数据并执行与整体操作相关的计算。然而,在这种存储器共享环境中存在固有的延迟限制。考虑节点(A)想要更新映射到远程节点(B)的本地地址空间中的行的场景。(A)首先必须从B获取和读取数据,对数据进行一些计算,并将数据存储回节点(B)上的存储器。在许多情况下,要在远程节点的存储器上执行的操作可以是简单的,例如,将远程节点中的存储器范围归零或执行诸如数据过滤或搜索的简单操作。通过结构复制数据、执行相对便宜的计算操作以及将数据移回远程节点的开销在应用参与数据传输所产生的额外延迟以及结构带宽消耗方面都是浪费的。结构带宽是指通过互连节点的交换结构交换的数据量,并且由于它是有限的资源,过度使用会产生延迟瓶颈。附图说明以下描述包括对具有通过本专利技术实施例的实现方式的示例的方式给出的图示的附图的讨论。附图应该通过示例的方式理解,而不是作为限制。如本文所使用的,对一个或多个“实施例”的引用应被理解为描述包括在本专利技术的至少一个实现方式中的特定特征、结构和/或特性。因此,这里出现的诸如“在一个实施例中”或“在替代实施例中”的短语描述了本专利技术的各种实施例和实现方式,并且不一定都指代相同的实施例。但是,它们也不一定是相互排斥的。图1是节点的网络的实施例的框图,其中具有存储器计算资源的节点可以暴露资源以供远程节点使用。图2A是具有存储器计算资源的远程节点的远程读取计算的实施例的框图。图2B是具有存储器计算资源的远程节点的远程写入计算的实施例的框图。图3A是节点的网络的节点的实施例的框图,其中存储器计算资源可由远程节点访问以便执行。图3B是具有存储器控制器的节点的网络的节点的实施例的框图,该存储器控制器基于节点内的多个存储器计算资源来注册存储器计算功能。图4是用于执行远程存储器计算的过程的实施例的流程图。图5是用于注册和发现远程存储器计算资源的过程的实施例的流程图。图6是可以实现远程存储器计算的多节点网络的实施例的框图。图7是用于多节点网络的计算系统的实施例的框图,其中可以实现远程存储器计算。以下描述某些细节和实施方式,包括附图的描述,其可描绘下文描述的一些或所有实施例,以及讨论本文中呈现的专利技术构思的其他可能的实施例或实施方式。具体实施方式如本文所述,节点的网络中的处理节点包括处理资源和存储器资源,并且存储器资源包括存储器计算资源。存储器计算资源使存储器子系统能够执行某些操作而不将数据推回到处理器。该节点包括结构互连管理器或结构接口,以通过互连结构耦合到网络中的其他节点。扩展了节点和网络的架构,以实现远程存储器计算的代理请求。节点可以向远程节点公开存储器计算能力。远程节点可以请求远程存储器计算资源执行操作,并且远程存储器计算资源可以在本地执行请求并返回计算的结果。存储器计算资源对请求的本地执行可以减少远程请求的典型延迟和带宽问题。本地计算不要求在结构上来回发送数据以执行计算,并且不通过要求由本地处理器执行计算来弄脏本地缓存。这种解决方案是对使用远程操作或“原子”将计算推送到主机结构接口(HFI)的现有解决方案的改进。有许多操作需要像原子一样遍历大量数据,这使得HFI执行操作效率低下。例如,涉及大规模数据并行操作的操作在被从存储器中的数据推送时失去了数据并行性的优点。此外,涉及归零数据或计算页级校验和或其他操作的操作具有保持尽可能接近数据的优点,并且以其他方式需要在带宽受限的互连上移动大量数据。在传统系统中,没有机制使得能够在结构上推送计算以由远程节点的存储器层次结构执行,而不是通过结构交换数据或通过远程处理资源执行计算。如本文所述,可以暴露存储器计算能力用于远程请求,并且节点的存储器子系统可以接收远程请求并响应于远程请求而执行操作。存储器层次结构可以返回操作的结果,而不需要通过结构交换数据,或甚至要求通过本地处理资源或HFI访问数据。图1是节点的网络的实施例的框图,其中具有存储器计算资源的节点可以暴露资源以供远程节点使用。系统100包括经由主机结构102耦合在一起的多个节点。系统100示出了四个不同的节点,节点0、节点1、节点2和节点3。应当理解,系统100可以包括更多节点。通常,服务器系统或数据中心将包括数十个或数百个或数千个节点。系统100中示出的节点表示可以包括的节点类型的非限制性示例。在一个实施例中,可以在同一网络中实现不同类型的节点。在一个实施例中,系统100中的节点将是相当统一的。其中节点包括存储器资源的任何类型的系统100可以实现远程存储器操作的实施例。主机结构102表示互连系统,其包括交换机、路由器或其他硬件设备或组合,以实现从一个节点到另一个节点的数据流。结构102实现诸如以太网、TCP/IP(传输控制协议/网际协议)或其他协议之类的主机协议,以将数据从一个设备传输到另一个设备。系统100的节点经由结构互连机构(例如主机结构接口(HFI))互连到结构102。通常,HFI110表示将节点耦合到结构102的逻辑和硬件互连。在一个实施例中,HFI110包括用于管理到将节点连接到结构102的硬件组件的互连的一个或多个管理过程。在一个实施例中,这样的过程可以包括在节点处执行的一个或多个网络协议栈中的代理的实现。这样的协议栈可以在概念上将网络接口分离为包括多个层,例如与主机操作系统一起操作或在主机操作系统下操作的应用或代理,驱动应用的特定硬件功能的一个或多个驱动器软件层,实现特定的机器代码以实现由驱动器指导的功能的硬件设备的一个或多个固件层,以及响应于机器代码以经由寄存器、端口、硬件驱动器交换(例如,发送或接收或两者)数据(例如,生成数据信号)的硬件逻辑。这种协议栈有许多已知的变体,这里不再详细讨论。HFI110表示这样的栈或其他硬件和软件机制或用于管理在结构102上与其他设备交换命令/请求和数据的组合。节点0表示一般在系统100内的节点,并且节点1、2和3可以是根据节点0的节点的更具体的表示。节点0经由HFI110[0]与结构102互连。在一个实施例中,节点0包括插座120,插座120通常表示使得能够在节点0中包括处理器或CPU(中本文档来自技高网...

【技术保护点】
1.一种节点的网络中的节点,包括:结构接口,用于经由互连结构耦合到所述节点的网络;处理器,用于在所述节点处执行操作;以及存储器子系统,其具有与所述处理器分离的存储器计算资源;其中,所述存储器子系统接收来自远程节点处理器的针对存储器计算的请求,并且响应于所述请求,在所述存储器子系统处本地地执行所述计算并且将所述计算的结果发送到所述远程节点。

【技术特征摘要】
【国外来华专利技术】2016.07.01 US 15/201,3731.一种节点的网络中的节点,包括:结构接口,用于经由互连结构耦合到所述节点的网络;处理器,用于在所述节点处执行操作;以及存储器子系统,其具有与所述处理器分离的存储器计算资源;其中,所述存储器子系统接收来自远程节点处理器的针对存储器计算的请求,并且响应于所述请求,在所述存储器子系统处本地地执行所述计算并且将所述计算的结果发送到所述远程节点。2.如权利要求1所述的节点,其中,所述节点包括数据中心中的服务器的节点。3.如权利要求1至2中任一项所述的节点,其中,所述结构接口包括用于耦合到主机交换结构的主机结构接口(HFI)。4.如权利要求1至3中任一项所述的节点,其中,所述结构接口用于接收通过结构协议隧道传送的所述请求,并且用于通过所述结构协议将所述结果隧道传送到所述远程节点。5.如权利要求1至4中任一项所述的节点,其中,所述存储器子系统还包括存储器控制器,所述存储器控制器用于向所述结构接口注册所述存储器计算资源的能力。6.如权利要求5所述的节点,其中,所述结构接口用于向所述网络中的其他节点暴露所述存储器计算资源的能力。7.如权利要求1至6中任一项所述的节点,其中,所述结构接口用于暴露与所述存储器计算资源的能力相对应的通用唯一标识符(UUID)。8.如权利要求1至7中任一项所述的节点,其中,所述结果包括从所述计算得到的数据。9.如权利要求1至7中任一项所述的节点,其中,所述结果包括所述计算的执行的确认消息而没有结果数据。10.如权利要求1至9中任一项所述的节点,其中,所述存储器子系统用于在所述存储器子系统处本地地存储结果数据。11.如权利要求1至10中任一项所述的节点,其中,所述远程节点包括处理节点,并且所述节点包括处理节点。12.如权利要求1至10中任一项所述的节点,其中,所述远程节点包括处理节点,并且所述节点包括存储服务器。13.如权利要求1所述的节点,还包括所述远程节点...

【专利技术属性】
技术研发人员:F·甘博纳特K·库马尔T·维尔哈姆N·兰加纳坦P·沃格特
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1