当前位置: 首页 > 专利查询>英特尔公司专利>正文

为裸机部署支持运行时间SMM更新和遥测的系统和方法技术方案

技术编号:37179340 阅读:11 留言:0更新日期:2023-04-20 22:46
本公开涉及为裸机部署支持运行时间SMM更新和遥测的系统和方法。在运行时间支持系统管理模式(SMM)更新和遥测以用于裸机部署的的系统和方法。主机操作系统在裸机平台上,该裸机平台具有管理控制器并包括在其上执行主机操作系统(OS)和主机BIOS的处理单元,在主机操作系统的运行时间操作期间:使用带外信道对裸机平台执行对安全执行模式(例如,SMM)运行时间固件的运行时间更新,带外信道包括管理控制器和主机BIOS之间的中断驱动的、基于共享存储器的数据交换信道。这使得安全执行模式运行时间固件能够在运行时间期间进行更新,无需重新启动平台或重新开启OS内核。带外通道还支持在运行时间更新期间与管理控制器交换由主机BIOS记录的遥测数据。记录的遥测数据。记录的遥测数据。

【技术实现步骤摘要】
为裸机部署支持运行时间SMM更新和遥测的系统和方法
[0001]优先权
[0002]本申请要求2021年8月5日提交的申请号为PCT/CN2021/110756的专利合作条约(PCT)申请的优先权权益。该申请的全部内容通过引用被并入本文。

技术介绍

[0003]大规模部署服务器机组的商业模式促使我们必须避免系统重置,并且系统重置只应被视为最后的选择。这是由于云服务提供商(CSP)会因重置系统或重启内核导致的系统停机和工作负载中断而产生大量成本。与此同时,CSP对运行时间的重新配置、安全修复等方面的需求越来越多。
[0004]这带来了一些问题。例如,注入平台配置/行为更改、或安全修复会导致一个问题。这些通常是一次性注入文件或策略重新配置、或安全修复,以用于锁定寄存器。例如,可能存在一些需要重新配置的性能旋钮或错误严重程度映射,或者需要锁定寄存器作为安全修复的结果。此外,可以通过SMM(系统管理模式)权限来保护这些配置寄存器(例如,只有具有SMM权限的代码才能修改它们)。即使它们可以是Ring

0可访问的,也需要操作系统(OS)准许大量更改工作/内核,这将需要重新开启内核,这是破坏性的。
[0005]无缝SMM运行时间更新对于解决SMM服务更新导致的服务中断的CSP客户的痛点至关重要。然而,对于CSP来说,为了SMM运行时间更新而在操作系统(OS)中保持单独的带内更新代理是一项重大挑战,这会给大规模部署的CSP商业模式带来额外的成本。
[0006]在另一个问题下,供应商为处理器漏洞/安全修复提供微代码(uCode)补丁。通常,给定的uCode补丁可以为某个配置产生新的机器特定寄存器(MSR),这将需要对其进行编程以使其生效。现今,在发布uCode更新之前,必须提供操作系统内核补丁。客户必须在uCode补丁更新之前修补他们的OS内核,而这通常需要修补内核、以及重置平台/内核,这是破坏性的。这些需要在更新BIOS(例如,固件)和/或更新内核之后重置系统/重置内核,以使其生效,这违背了避免重启系统/内核(重启系统/内核是极具破坏性的)的原则和要求。

技术实现思路

[0007]根据本公开的实施例,提供了一种方法,包括:在主机操作系统的运行时间操作期间执行操作,其中所述主机操作系统在裸机平台上,所述裸机平台具有管理控制器并包括处理单元,所述主机操作系统和主机BIOS在所述处理单元上执行,所述操作包括:使用带外信道对所述裸机平台执行对安全执行模式运行时间固件的运行时间更新,所述带外信道包括所述管理控制器和所述主机BIOS之间的中断驱动的、基于共享存储器的数据交换信道。
[0008]根据本公开的实施例,提供了一种裸机平台,包括:主机中央处理单元(CPU);主机存储器,耦合到所述主机CPU;以及管理控制器,直接或间接地通信耦合到所述主机CPU并具有板载存储器缓冲区,其中,所述裸机平台被配置为在云服务提供商环境中实现,在所述云服务提供商环境中,在所述主机CPU上执行所述在主机操作系统和主机BIOS,并且其中,所述裸机平台被配置为使用带外信道对所述裸机平台执行对安全执行模式运行时间固件的
或“在一实施例中”在本说明书各处的出现不一定全都指的是同一实施例。此外,特定的特征、结构或特性在一个或多个实施例中可按任何适当的方式被组合。
[0021]为了清楚起见,本文的附图中的个体组件也可以由其在附图中的标签而不是由特定的标号来指代。此外,指代特定类型的组件(而不是特定组件)的标号可以通过在标号后面跟着意指“典型”的“(typ)”来示出。将会理解,这些组件的配置将是可能存在、但为了简单和清楚起见而没有在附图中示出的类似组件或者没有用分开的标号标注的其他类似组件的典型配置。相反,“(typ)”不应被解释为表示该组件、元素等通常被用于其公开的功能、实现、目的等。
[0022]图1根据一个实施例示出了SMM运行时间更新解决方案的高级系统和架构100。这些组件包括编排器102、经移除的固件(FW)更新代理104、以及经移除的_DSM方法106(以虚线轮廓示出,以指示它们已经被移除)、SCI中断处理程序108、ACPI控制方法110、基板管理控制器(BMC)代理112、SMM通信缓冲区114、片上BMC存储器116、SMM运行时间更新SMI处理程序118、以及SMM遥测SMI处理程序120。这些组件被划分为主机OS(软件)组件、高级配置和电源接口(ACPI)组件、BMC组件、以及SMM(固件)组件。
[0023]架构100的系统使用BMC代理112作为使用带外(out

of

band,OOB)信道的更新代理,而不是使用先前在主机OS中用于带内(in

band,IB)信道的专用FW更新代理104。BMC代理112与编排器102(例如,管理员)交互以监视系统状态并管理运行时间固件更新。如本文所使用的,“带内”意指采用由操作系统提供的通信设施的通信信道(例如,网络软件栈)。此外,如本文所使用的,“带外”意指不采用由操作系统提供的通信设施的通信信道。结果,带外通信被与涉及主机操作系统的通信分开并远离涉及主机操作系统的通信实现。
[0024]在一个实施例中,基于增强型串行外围接口(eSPI)的存储器映射BMC接口(MMBI)协议被用于BMC和系统的主机BIOS(ACPI和SMM)之间的数据交换。例如,BMC代理112被示为通过eSPI链路122经由MMBI与SCI中断处理程序108通信。
[0025]通过基于eSPI的MMBI协议,BMC存储器116的一部分被映射到主机存储器映射输入输出(MMIO)区域,这为在SMM运行时间更新期间传输必要的命令和更新映像提供了有效的通信信道。下面参考图5描述基于eSPI的MMBI协议的更多细节。然而,因为也可以使用其他现有的和未来的数据传输机制(例如但不限于PCIe),所以本文所说明和讨论的基于eSPI的MMBI协议的使用仅仅是示例性的而不是限制性的。
[0026]主机固件中的SCI中断处理程序108(或诸如SMI或GPIO(通用IO)中断之类的其他中断机制)被用于允许BMC发起SMM运行时间更新(包括SMM代码注入或SMM驱动程序更新)或撷取SMM遥测日志数据。SCI中断处理程序108负责以下项:从BMC代理112撷取MMBI命令、处理请求数据、触发相应的SMI处理程序、并用结果响应于BMC。
[0027]提供了将ACPI对象编码为二进制流的机制,反之亦然,这允许BMC向主机BIOS发送命令,并触发ACPI控制方法110,以执行具有指定参数的SMM运行时间更新功能。这提供了与先前的带内SMM运行时间更新解决方案的兼容性,从而允许CSP客户根据需要在同一平台上使用IB/OOB信道或者向现有平台添加新的OOB机制,而无需对平台固件进行重大修改。
[0028]如图1进一步所示,遥测日志数据126和更新胶囊(capsule)128被存储在BMC存储器116中。类似地,SMM通信缓冲区1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方法,包括:在主机操作系统的运行时间操作期间执行操作,其中所述主机操作系统在裸机平台上,所述裸机平台具有管理控制器并包括处理单元,所述主机操作系统和主机BIOS在所述处理单元上执行,所述操作包括:使用带外信道对所述裸机平台执行对安全执行模式运行时间固件的运行时间更新,所述带外信道包括所述管理控制器和所述主机BIOS之间的中断驱动的、基于共享存储器的数据交换信道。2.根据权利要求1所述的方法,其中,所述裸机平台包括主机存储器,并且所述方法包括:在所述管理控制器处接收包含安全执行模式运行时间更新映像的更新胶囊;将所述安全执行模式运行时间更新映像缓冲在所述管理控制器的板载的存储器中,所述板载的存储器的至少一部分被存储器映射到所述主机存储器中的地址空间;以及使用一个或多个带外数据传输,以将所述安全执行模式运行时间更新映像传输到所述主机存储器中的经保留的安全执行模式缓冲区。3.根据权利要求2所述的方法,其中,所述管理控制器包括基板管理控制器(BMC),所述方法还包括:a)将映像数据放置在存储器映射的BMC到主机缓冲区中,所述映像数据包括所述安全执行模式运行时间更新映像的全部或部分;b)由所述BMC提出中断;并且作为响应,c)在BIOS中执行中断处理程序,以将所述映像数据从所述BMC到主机缓冲区复制到所述主机存储器中的所述经保留的安全执行模式缓冲区;以及d)根据需要重复操作a)、b)和c),直到所述安全执行模式运行时间更新映像整体被复制到所述经保留的安全执行模式缓冲区。4.根据权利要求3所述的方法,其中,所述裸机平台还包括一个或多个高级配置和电源接口(ACPI)组件,其中,所述主机BIOS的一部分包括ACPI BIOS,其中,所述中断包括系统控制中断(SCI),并且所述中断处理程序包括所述ACPI BIOS中的SCI处理程序。5.根据权利要求2所述的方法,还包括:采用安全执行模式中断处理程序来激活所述安全执行模式运行时间更新映像。6.根据权利要求5所述的方法,还包括:使用所述安全执行模式中断处理程序记录遥测数据,所述遥测数据与激活所述安全执行模式运行时间更新映像相关。7.根据权利要求6所述的方法,其中,所述遥测数据被记录在为所述安全执行模式分配的主机存储器的经保留的部分中,所述方法还包括:使用带外信道读取从所述主机存储器的经保留部分记录至所述管理控制器上的缓冲区的遥测数据。8.根据权利要求1所述的方法,其中,所述管理控制器包括基板管理控制器(BMC),并且所述带外信道采用存储器映射BMC接口(MMBI)协议。9.根据权利要求8所述的方法,其中,所述MMBI协议采用所述BMC上的两个存储器映射缓冲区,包括:用于通过所述带外信道将数据从所述BMC发送到所述主机BIOS的BMC到主机
缓冲区、以及用于从所述主机BIOS接收数据的主机到BMC缓冲区。10.一种裸机平台,包括:主机中央处理单元(CPU);主机存储器,耦合到所述主机CPU;以及管理控制器,直接或间接地通信耦合到所述主机CPU并具有板载存储器缓冲区,其中,所述裸机平台被配置为在云服务提供商环境中实现,在所述云服务提供商环境中,在所述主机CPU上执行所述在主机操作系统和主机BIOS,并且其中,所述裸机平台被配置为使用带外信道对所述裸机平台执行对安全执行模式运行时间固件的运行时间更新,所述带外信道包括所述管理控制器和所述主机BIOS之间的中断驱动的、基于共享存储器的数据交换信道。11.根据权利要求10所述的裸机平台,还被配置为:在所述管理控制器处接收包含安全执行模式运行时间更新映像的更新胶囊;将所述安全执行模式运行时间更新映像缓冲在所述管理控制器的板载的存储器中,所述板载的存储器的至少一部分被存储...

【专利技术属性】
技术研发人员:付思源穆鲁加萨米
申请(专利权)人:英特尔公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1