当前位置: 首页 > 专利查询>英特尔公司专利>正文

使用高性能存储器改善系统存储器访问性能技术方案

技术编号:37102995 阅读:15 留言:0更新日期:2023-04-01 05:02
系统包括处理器,该处理器能通信地耦合至高性能存储器(130);以及存储器设备(140),该存储器设备(140)能通信地耦合至处理器,用于存储平台初始化固件以使处理系统(100):在处理系统(100)的引导过程期间,将高性能存储器(130)作为用于处理系统(100)的系统存储器初始化;在引导过程期间,生成高性能存储器(130)的位置信息;在引导过程期间,将高性能存储器(130)的位置信息报告给操作系统(OS);并将与位置信息相对应的信息转发至高性能存储器(130)。系统涉及使用高性能存储器(130)改善系统存储器访问性能。统存储器访问性能。统存储器访问性能。

【技术实现步骤摘要】
【国外来华专利技术】使用高性能存储器改善系统存储器访问性能

技术介绍

[0001]处理系统可包括硬件组件和软件组件。软件组件可包括一个或多个应用、操作系统(operating system,OS)和固件。应用可包括用于执行对于处理系统的用户而言有价值的工作的控制逻辑。在处理系统中,应用在OS之上运行,OS在相比于应用更低的逻辑级处(即,更靠近硬件)运行,以提供使得更易于创建和执行应用的底层环境或抽象层。固件在甚至更低的逻辑级处运行,以提供使得更易于创建和执行OS的底层环境或抽象层。例如,固件可建立基本输入/输出系统(basic input/output system,BIOS),并且OS可使用该BIOS来与处理系统内的不同硬件组件进行通信。
[0002]典型地,OS和应用在易失性的随机存取存储器(random

access memory,RAM)之外执行。固件中的一些或全部也可在RAM之外执行。然而,由于RAM是易失性的,因此每当处理系统被关闭时,用于执行有用工作的环境基本上都会消失。因此,每当处理系统被打开时,该处理系统应当在有用工作可以被执行之前重新创建那种环境。出于本公开的目的,用于使处理系统准备好执行OS的操作可被称为“引导过程”。类似地,在引导过程期间消逝的时间可被称为“引导时间”。
附图说明
[0003]本文所描述的实施例作为示例而非限制在所附附图的各图中示出,在附图中,同样的附图标记指代类似的要素。
[0004]图1描绘了根据本公开的实现方式的、使用高性能存储器提供改善系统存储器访问性能的处理系统的图示。
[0005]图2是图示了根据本公开的实现方式的、使用高性能存储器改善系统存储器访问性能的处理系统的框图。
[0006]图3是描绘了根据本公开的实现方式的、用于使用高性能存储器改善系统存储器访问性能的引导过程的流程示意图。
[0007]图4图示了根据本公开的实现方式的、使用高性能存储器改善系统存储器访问性能的示例流程。
[0008]图5图示了根据本公开的实现方式的、用于使用高性能存储器改善系统存储器访问性能的另一示例流程。
[0009]图6是根据本公开的实现方式的、使用高性能存储器实现改善系统存储器访问性能的说明性的电子计算设备的示意图。
具体实施方式
[0010]本文中所描述的实施例涉及使用高性能存储器改善系统存储器访问性能。
[0011]如上文所指示,当处理系统被打开或被重置时,处理系统可在处理系统可以被用于工作之前执行引导过程。如本文中所讨论,用于使处理系统准备好执行操作系统(OS)的操作可被称为“引导过程”。类似地,在引导过程期间消逝的时间可被称为“引导时间”。执行
或控制引导过程的控制逻辑或固件可被称为“系统固件”、“系统引导代码”、“平台引导代码”,或者简称为“引导代码”。
[0012]引导过程可以包括存储器训练阶段。在存储器训练阶段期间,存储器训练代码(诸如,存储器参考代码(memory reference code,MRC))使用存储器控制器来测试存储器总线并针对系统的存储器模块的每个通道的所确定的余量调整定时/电压参考(voltage reference,Vref)。可以基于系统的主板硬件和存储器模块来生成存储器训练数据。因此,存储器训练阶段不能被跳过以减少整体引导过程时间。
[0013]随着存储器技术的改善,存储器模块容量(诸如,双列直插式存储器模块(dual in

line memory module,DIMM)容量)代代相传地指数式地增加。因此,引导时间的增加与存储器模块容量的增加相对应,是因为存储器训练时间和存储器测试时间与存储器模块(例如,DIMM)大小直接地成正比。这发生在常规的双数据速率5(dual data rate 5,DDR5)服务器平台中。
[0014]此外,为了支持DDR5 DIMM容量增加,常规的操作系统(OS)利用五级(5

level)页表来支持DDR5。5级分页可以指用于将虚拟地址的大小从48比特扩展到57比特的处理器扩展,,从而将可寻址虚拟存储器从256TiB增加到128PiB。转译后备缓冲器(translation lookaside buffer,TLB)是存储器缓存,其存储虚拟存储器到物理地址的最近转译,用于更快的取回。一旦将虚拟地址转译为相对应的真实地址,该查找的结果就会被缓存在TLB中,以对于后续访问提供“快速路径”查找。TLB“未命中”意味着关联尚未被缓存,因此“长形式”查找转译被使用,并且处理系统应通过解析每个级的页表将虚拟地址转译为物理地址。
[0015]在常规的处理系统中,在TLB未命中发生时用于将虚拟地址转译为物理地址的页表在存储器模块(诸如,DIMM模块的DDR5存储器)中被维护。在一些处理系统中,页表是5级页表,该5级页表在TLB未命中发生时进行5次存储器读取,而总共需要6次存储器读取才能获得存储器数据。这会影响系统存储器访问性能,从而降低整体处理系统性能。此外,高性能需求软件(诸如,例如,人工智能(artificial intelligence,AI)训练、虚拟化系统、OS内核、多线程共享数据、云服务和企业应用/数据库)目前在常规的处理系统中的典型DDR存储器上运行。当此类软件由于其高性能需求而对处理系统造成压力时,这会影响此类高性能需求软件和底层处理系统本身的系统性能。
[0016]本公开的实现方式通过使用高性能存储器提供改善的系统存储器访问性能来解决上述技术问题。高性能存储器可以指例如高带宽存储器(High Bandwidth Memory,HBM)、双倍数据速率(double data rate,DDR)存储器模块、图形DDR(graphics DDR,GDDR)存储器模块、DDR和/或GDDR的组合,或以更小的形状因子使用降低的功率的同时提供高性能带宽的任何其他存储器。HBM可以被集成到处理系统的CPU封装中,并可以提供改善的存储器带宽。在一些情况下,HBM带宽可以是常规DDR5带宽的20倍。HBM存储器具有两个主要用途,它或者可以是“扁平模式”,或者它可以被用作用于DDR5远存储器的缓存。
[0017]在本公开的实现方式中,高性能存储器在处理系统的引导过程期间作为系统存储器被初始化并被建立,并且随后被用于承载系统页表和/或任何高性能需求软件。在一种实现方式中,引导过程的引导阶段与系统的OS协调以提供经初始化的高性能存储器的位置和/或带宽信息,使得OS可以将页表和/或高性能需求软件放置在高性能存储器中。位置和/或带宽信息在引导过程期间被提供,以使OS能够在系统初始化期间在高带宽存储器中建立
页表。在一些实现方式中,引导过程创建一个或多个表来存储高性能存储器的位置和带宽信息,其中该一个或多个表在引导过程期间被报告给OS。
[0018]由此,本公开的实现方式通过改善处理器虚拟地址到物理地址的转译效率来改善处理系统性能,改善存储器模块访问(诸如,DDR存储器(包括DDR5存储本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种处理系统,包括:处理器,能通信地耦合至高性能存储器;以及存储器设备,能通信地耦合至所述处理器,用于存储平台初始化固件以使所述处理系统:在所述处理系统的引导过程期间,将所述高性能存储器作为用于所述处理系统的系统存储器初始化;在所述引导过程期间,生成所述高性能存储器的位置信息;在所述引导过程期间,将所述高性能存储器的所述位置信息报告给操作系统(OS);以及将与所述位置信息相对应的信息转发至所述高性能存储器。2.如权利要求1所述的处理系统,其中,所述高性能存储器包括作为用于所述处理系统的系统存储器被初始化的高带宽存储器(HBM)。3.如权利要求1所述的处理系统,其中,页表或高性能需求软件中的至少一者根据所述位置信息被放置在所述高性能存储器中。4.如权利要求3所述的处理系统,其中,所述平台初始化固件用于进一步使所述处理系统在所述引导过程期间将所述高性能存储器的带宽信息报告给所述OS,并且其中页表和所述高性能需求软件中的至少一者根据所述带宽信息被放置在所述高性能存储器中。5.如权利要求1所述的处理系统,其中,所述位置信息在一个或多个表中被提供,所述一个或多个表包括高级配置和功率接口(ACPI)表。6.如权利要求5所述的处理系统,其中,所述ACPI表包括系统资源关联表(SRAT)、系统位置距离信息表(SLIT)或异构存储器属性表(HMAT)中的至少一者。7.如权利要求3所述的处理系统,其中,所述高性能需求软件包括人工智能(AI)训练、虚拟化服务、OS内核、多线程共享数据、云服务、企业应用或企业数据库中的至少一者。8.如权利要求3所述的处理系统,其中,所述页表在所述高性能存储器中被访问来执行虚拟地址到物理地址的转译以访问存储在一个或多个存储器模块中的存储器页。9.一种方法,包括:在处理系统的引导过程期间,将高性能存储器作为用于处理系统的系统存储器初始化;在所述引导过程期间,生成所述高性能存储器的位置信息;在所述引导过程期间,将所述高性能存储器的所述位置信息报告给操作系统(OS);以及将与所述位置信息相对应的信息转发至所述高性能存储器。10.如权利要求9所述的方法,其中,所述高性能存储器包括被用作用于所述处理系统的系统存储器的高带宽存储器(HBM)。11.如权利要求9所述的方法,其中,所述高性能存储器与所述处理系统的一个或多个存储器模块是分开的,所述一个或多个存储器模块包括动态随机存取存储器(DRAM)模块。12.如权利要求9所述的方法,其中,所述位置信息在一个或多个表中被...

【专利技术属性】
技术研发人员:许涛李玉福朱磊刘仕杰
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1