当前位置: 首页 > 专利查询>英特尔公司专利>正文

用于经由使用可用设备存储器扩展系统存储器的技术技术方案

技术编号:37977307 阅读:7 留言:0更新日期:2023-06-30 09:52
示例包括用于经由使用可用设备存储器来扩展系统存储器的技术。耦合到主机设备的设备处的电路分区出存储器的存储器容量的一部分,该存储器被配置用于由驻留在该设备处的用于执行工作负载的计算电路使用。向主机设备报告存储器容量的分区出的部分可用作系统存储器的一部分。从主机设备接收以下指示:存储器容量的该部分是否已被识别用作池化系统存储器的第一部分。该电路用于监控由用于执行工作负载的计算电路使用的存储器容量的使用,以决定是否向主机设备发出请求,以从池化系统存储器的第一部分回收存储器容量。的第一部分回收存储器容量。的第一部分回收存储器容量。

【技术实现步骤摘要】
用于经由使用可用设备存储器扩展系统存储器的技术


[0001]本文中描述的示例涉及池化存储器。

技术介绍

[0002]创意专业人士或个人计算机(personal computer,PC)游戏玩家使用的计算系统类型可以包括使用包括大量存储器的设备。例如,创意专业人士或PC游戏玩家可能使用包括大量存储器以支持由一个或多个图形处理单元进行的图像处理的独立显卡(graphics card)。存储器可以包括图形双倍数据速率(graphics double data rate,GDDR)或具有数千兆字节(GB)的存储器容量的其他类型的DDR存储器。虽然创意专业人士或PC游戏玩家在执行密集/特定任务时可能需要大量存储器,但是大量的操作运行时间可能不需要如此大量的设备存储器。
附图说明
[0003]图1示出了示例系统。
[0004]图2示出了系统的另一个示例。
[0005]图3示出了示例第一过程。
[0006]图4A至图4B示出了示例第二过程。
[0007]图5示出了示例第一方案。
[0008]图6示出了示例第二方案。
[0009]图7示出了示例第三方案。
[0010]图8示出了示例第四方案。
[0011]图9示出了示例第一逻辑流程。
[0012]图10示出了示例装置。
[0013]图11示出了示例第二逻辑流程。
[0014]图12示出了存储介质的示例。
[0015]图13示出了示例设备。
具体实施方式
[0016]在当今的一些示例计算系统中,大多数附加或独立显卡(graphics card)或加速器卡伴随有多GB的存储器容量的各类型的存储器,例如但不限于DDR、GDDR、或高带宽存储器(high bandwidth memory,HBM)。在例如被用于游戏和人工智能(artificial intelligence,AI)工作(例如,CUDA、One API、OpenCL)时,该多GB的存储器容量可以专门供驻留在相应的独立显卡或加速器卡上的GPU或加速器使用。同时,计算系统还可以被配置为支持诸如之类的应用或多租户应用工作(无论是商业还是创意类型的工作负载+多个互联网浏览器选项卡)。在支持这些应用时,计算系统可能会达到系统存储器限制,然而独立显卡或加速器卡上具有可能未被使用的大量存储器容量。如果独立显
卡或加速器卡上的存储器容量可用于共享该设备存储器容量的至少一部分以用作系统存储器,则与支持应用相关联的工作负载的性能可以得到改进,并且在平衡计算系统的总体存储器需求时提供更好的用户体验。
[0017]在一些存储器系统中,一致性存储器访问(unified memory access,UMA)可以是一种共享存储器架构,该共享存储器架构被部署用于共享存储器容量,以用于执行图形或加速器工作负载。UMA可以使GPU或加速器保留一部分系统存储器,以用于图形或加速器特定工作负载。然而,UMA通常从来不会撤回这部分系统存储器来通用作系统存储器。共享系统存储器的使用成为要支持的固定成本。此外,在UMA存储器架构中,专用的GPU或加速器的存储器容量不能被主机计算设备看到还能用作系统存储器。
[0018]计算快速链路(Compute Express Link,CXL)联盟的一项新的技术规范是于2020年10月26日发布的Compute Express Link Specification,Rev.2.0,Ver.1.0,以下简称为“CXL规范”。CXL规范介绍了通过被配置为根据CXL规范操作的一个或多个设备(例如,GPU设备或加速器设备)(以下简称为“CXL设备”)而附接到主机计算设备(例如,服务器)的联机和脱机的存储器。通过一个或多个CXL设备附接到主机计算设备的联机和脱机的存储器通常用于但不限于以下目的:在CXL设备和主机计算设备之间对存储器资源进行存储器池化,以用作系统存储器(例如,主机控制的存储器)。然而,对用于存储器池化的物理存储器地址范围进行暴露、以及从存储器池中删除这些物理存储器地址的过程,是由给定CXL设备外部的逻辑和/或特征(例如,主机计算设备处的CXL交换机结构管理器)完成的。为了更好地实现基于设备的需要或不需要该存储器容量而对CXL设备的存储器容量的动态共享,可能需要设备处内部的逻辑和/或特征来决定是暴露还是从存储器池中删除物理存储器地址。针对这些挑战,需要本文中描述的示例。
[0019]图1示出了示例系统100。在一些示例中,如图1所示,系统100包括主机计算设备105,主机计算设备105具有根联合体(root complex)120,以经由至少存储器事务链路113和输入/输出IO事务链路115与设备130耦合。如图1所示,主机计算设备105还经由一个或多个存储器通道101与主机系统存储器110耦合。对于这些示例,主机计算设备105包括用于执行或支持一个或多个设备驱动器104的主机操作系统(operating system,OS)102、主机基本输入/输出系统(basic input/output system,BIOS)106、一个或多个主机应用108、以及用于支持主机计算设备105的计算操作的主机中央处理单元(central processing unit,CPU)107。
[0020]在一些示例中,尽管在图1中被示出为与主机CPU 107分离,但是在其他示例中,根联合体120可以与主机CPU 107集成。对于任一示例,根联合体120可以被布置为用作一种类型的外围组件接口快速(peripheral component interface express,PCIe)根联合体,其用于CPU 107和/或主机计算设备105的其他元件,以经由使用基于PCIe的通信协议和通信链路与诸如设备130之类的设备进行通信。
[0021]根据一些示例,根联合体120还可以被配置为根据CXL规范操作,并且如图1所示地包括IO桥接器121和归属代理124,IO桥接器121包括IO存储器管理单元(IO memory management unit,IOMMU)123,IOMMU 123用于促进经由IO事务链路115与设备130的通信,归属代理124用于促进经由存储器事务链路113与设备130的通信。对于这些示例,存储器事务链路113可以类似于CXL.mem事务链路进行操作,IO事务链路115可以类似于CXL.io事务
链路进行操作。如图1所示并且在下文更详细地描述的,根联合体120包括主机管理的设备存储器(host

managed device memory,HDM)解码器126,主机管理的设备存储器解码器126可以被编程为促进主机到设备物理地址的映射,该设备物理地址用于在系统存储器(例如,池化系统存储器)中使用。根联合体120处的存储器控制器(memory controller,MC)122可以控制/管理通过存储器通道101对主机系统存储器110的访问。主机系统存储器110可以包括易本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种装置,包括:设备处的电路,所述设备与主机设备耦合,所述电路用于:分区出存储器的第一部分存储器容量,所述存储器被配置用于由驻留在所述设备处的用于执行工作负载的计算电路使用,所述第一部分存储器容量具有设备物理地址(DPA)范围;向所述主机设备报告:所述存储器的具有所述DPA范围的所述第一部分存储器容量能够用作由所述主机设备管理的池化系统存储器的一部分;以及从所述主机设备接收以下指示:所述存储器的具有所述DPA范围的所述第一部分存储器容量已被识别用作池化系统存储器的第一部分。2.根据权利要求1所述的装置,其中,由所述主机设备管理的池化系统存储器的第二部分包括:针对驻留在所述主机设备上或直接附接到所述主机设备的存储器的物理存储器地址范围。3.根据权利要求2所述的装置,其中,所述主机设备将非分页存储器分配引导至池化系统存储器的所述第二部分,并且防止非分页存储器分配到达池化系统存储器的所述第一部分。4.根据权利要求2所述的装置,包括:所述主机设备使得存储器分配被指定给由所述主机设备托管的应用,以供所述应用存储数据,所述存储器分配被映射到包括在池化系统存储器的所述第一部分中的物理存储器地址,其中,响应于所述应用请求对所述存储器分配的锁定,所述主机设备使得所述存储器分配被重新映射到包括在池化系统存储器的所述第二部分中的物理存储器地址,并使得存储于包括在所述第一部分中的物理存储器地址的数据被复制到包括在所述第二部分中的物理存储器地址。5.根据权利要求2所述的装置,还包括:所述电路用于:监控对被配置用于由驻留在所述设备处的所述计算电路使用的所述存储器的存储器使用,以确定所述计算电路是否需要所述第一部分存储器容量来执行所述工作负载;基于确定需要所述第一部分存储器容量,使得请求被发送到所述主机设备,所述请求用于回收正在用作所述第一部分的具有所述DPA范围的所述第一部分存储器容量;以及响应于对所述请求的批准,移除对被配置用于由所述计算电路使用的所述存储器的所述第一部分存储器容量的分区,使得所述计算电路能够使用所述存储器的所有存储器容量来执行所述工作负载。6.根据权利要求1所述的装置,包括:所述设备经由一个或多个计算快速链路(CXL)事务链路与所述主机设备耦合,所述一个或多个计算快速链路事务链路包括CXL.io事务链路或CXL.mem事务链路。7.根据权利要求1所述的装置,所述计算电路包括图形处理单元,其中,所述工作负载是图形处理工作负载。8.根据权利要求1所述的装置,所述计算电路包括现场可编程门阵列或专用集成电路,其中,所述工作负载是加速器处理工作负载。9.一种方法,包括:在与主机设备耦合的设备处,分区出存储器的第一部分存储器容量,所述存储器被配
置用于由驻留在所述设备处的用于执行工作负载的计算电路使用,所述第一部分存储器容量具有设备物理地址(DPA)范围;向所述主机设备报告:所述存储器的具有所述DPA范围的所述第一部分存储器容量能够用作由所述主机设备管理的池化系统存储器的一部分;以及从所述主机设备接收以下指示:所述存储器的具有所述DPA范围的所述第一部分存储器容量已被识别用作池化系统存储器的第一部分。10.根据权利要求9所述的方法,其中,由所述主机设备管理的池化系统存储器的第二部分包括:针对驻留在所述主机设备上或直接附接到所述主机设备的存储器的物理存储器地址范围。11.根据权利要求10所述的方法,其中,所述主机设备将非分页存储器分配引导至池化系统存储器的所述第二部分,并且防止非分页存储器分配到达池化系统存储器的所述第一部分。12.根据权利要求10所述的方法,还包括:所述主机设备使得存储器分配被指定给由所述主机设备托管的应用,以供所述应用存储数据,所述存储器分配被映射到包括在池化系统存储器的所述第一部分中的物理存储器地址,其中,响应于所述应用请求对所述存储器分配的锁定,所述主机设备使得所述存储器分配被重新映射到包括在池化系统存储器的所述第二部分中的物理存储器地址,并使得存储于包括在所述第一部分中的物理存...

【专利技术属性】
技术研发人员:蔡斯
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1