在计算机处理系统中存储器子系统维护期间减少系统停机时间技术方案

技术编号:17959592 阅读:45 留言:0更新日期:2018-05-16 05:20
公开了在计算机处理系统中存储器子系统维护期间减少系统停机时间。在一些方面,计算机处理系统包括通信地耦合到多个存储器插槽的计算机处理器,每个存储器插槽与存储器模块对接并且包括选通控制。该计算机处理器被进一步通信地耦合到专用非易失性存储设备。在检测到需要存储器模块的替换的存储器健康状况之际,阻止对该存储器模块的访问,并且将数据从该存储器模块传输到专用非易失性存储设备。存储器模块的存储器地址范围随后被重新映射到专用非易失性存储设备,使得对该存储器模块的后续存储器访问请求被重新路由到专用非易失性存储设备。该存储器模块的存储器插槽随后被门控,从而允许在维持系统可用性的同时执行维护。

Reduce system downtime during memory subsystem maintenance in computer processing system

It is disclosed that system downtime is reduced during the maintenance of memory subsystems in a computer processing system. In some respects, the computer processing system includes a computer processor that is coupled to a plurality of memory slots in a communication field, each memory slot butted with the memory module and includes the gated control. The computer processor is further coupled to a dedicated non-volatile storage device. The access to the memory module is prevented when the memory health status of a replacement of the memory module is detected, and the data is transmitted from the memory module to a dedicated non-volatile storage device. The memory address range of the memory module is then remapping to a dedicated non-volatile storage device, making the subsequent memory access request to the memory module rerouted to a dedicated nonvolatile storage device. The memory slot of the memory module is then gated so that maintenance can be maintained while maintaining system availability.

【技术实现步骤摘要】
【国外来华专利技术】在计算机处理系统中存储器子系统维护期间减少系统停机时间优先权要求本申请要求于2015年8月13日提交的题为“REDUCINGSYSTEMDOWNTIMEDURINGMEMORYSUBSYSTEMMAINTENANCEINACOMPUTERPROCESSINGSYSTEM(在计算机处理系统中存储器子系统维护期间减少系统停机时间)”的美国专利申请序列号14/825,495的优先权,该申请通过援引全部纳入于此。背景I.公开领域本公开的技术一般涉及为随机存取存储器模块提供支持的计算机架构。II.
技术介绍
现代计算系统(诸如数据中心服务器)经常负责执行关键任务软件应用。此应用可能代表组织的关键资产,并且因此该应用可能需要近乎恒定的系统可用性。因此,主流的信息技术(IT)实践试图最小化完成任务(诸如对服务器子系统进行维修或升级)所需的任何系统停机时间。然而,常规的计算机架构可使最小化系统停机时间复杂化,其可能不允许服务器子系统的“实时”系统维护(即,当服务器处于操作状态时执行的维修或升级)。在存储器子系统的特定情形中,基于常规计算机架构的服务器可能在存储器模块(诸如,双列直插式存储器模块(DIMM))被添加到服务器或从服务器中移除时不能继续操作。相反,在维护活动的历时期间,服务器必须“脱机”或完全关闭。这可能导致对整个系统的可用性产生负面影响的系统停机时间。此外,IT专业人员可能不能抢先检测和诊断服务器的特定存储器模块即将发生的故障。因此,IT专业人员在缓解非预期系统停机时间的影响方面可能面临更大的困难。公开概述在详细描述中公开的各方面包括在存储器子系统维护期间减少系统停机时间。还公开了相关系统、装置、方法和计算机可读介质。就此而言,在本文公开的一些示例性方面中,提供了一种用于监视存储器模块的存储器健康状况的计算机处理系统。该计算机处理系统启用存储器模块替换,而不需要使计算机处理系统脱机。作为示例,该计算机处理系统包括通信地耦合到多个存储器插槽的计算机处理器,每个存储器插槽与存储器模块(诸如,双列直插式存储器模块(DIMM))对接。该存储器插槽中的每一者包括启用存储器插槽的电压门控并且在一些方面启用存储器插槽的时钟门控的选通控制。作为非限制性示例,该计算机处理器进一步经由高速串行设备通道通信地耦合到专用非易失性存储设备,诸如固态驱动器(SSD)。作为非限制性示例,该计算机处理系统可与存储器监视代理协同工作以检测和监视存储器健康状况,诸如存储器错误状况和用户发起的升级请求。如果在存储器模块中检测到存储器健康状况,则存储器监视代理可确定存储器模块的替换是有保证的。相应地,可阻止对存储器模块的访问,并且将数据从存储器模块传输到专用非易失性存储设备。存储器模块的存储器地址范围随后可被重新映射到专用非易失性存储设备,使得对存储器模块的后续存储器访问请求被重新路由到专用非易失性存储设备。电压门控(以及可选的时钟门控)可被施加到存储器插槽,从而允许在计算机处理系统保持操作的同时移除和替换存储器模块。以此方式,可在对存储器模块执行维护的同时减少计算机处理系统的停机时间。在另一方面,提供了一种计算机处理系统。该计算机处理系统包括多个存储器插槽,每个存储器插槽包括选通控制并被配置为与存储器模块对接。该计算机处理系统进一步包括专用非易失性存储设备。该计算机处理系统还包括计算机处理器,其可通信地耦合到多个存储器插槽和专用非易失性存储设备。该计算机处理器被配置为检测与多个存储器插槽中的存储器插槽对接的存储器模块的存储器健康状况。该计算机处理器另外被配置为将与多个存储器插槽中的该存储器插槽对接的该存储器模块标识为存储器健康状况的源。该计算机处理器被进一步配置为将存储在存储器模块中的数据传输到专用非易失性存储设备。该计算机处理器还被配置为使用该存储器插槽的选通控制致使电压门控被施加到该存储器插槽以使存储器插槽成为不活跃。在另一方面,提供了一种计算机处理系统。该计算机处理系统包括用于检测与多个存储器插槽中的存储器插槽对接的存储器模块的存储器健康状况的装置。该计算机处理系统进一步包括用于将与多个存储器插槽中的该存储器插槽对接的该存储器模块标识为存储器健康状况的源的装置。该计算机处理系统还包括用于将存储在存储器模块中的数据传输到专用非易失性存储设备的装置。该计算机处理系统另外包括用于致使电压门控被施加到该存储器插槽以使存储器插槽成为不活跃的装置。另一方面,提供了一种促成计算机处理系统的维护的方法。该方法包括接收计算机处理系统的多个存储器模块中的存储器模块的存储器健康状况的指示。该方法进一步包括确定存储器健康状况是否保证存储器模块的替换。该方法还包括响应于确定存储器健康状况保证存储器模块的替换,基于接收到存储器健康状况的指示来阻止对存储器模块的存储器地址范围的访问。该方法另外包括:响应于确定存储器健康状况保证存储器模块的替换,发起存储在存储器模块中的数据到计算机处理系统的专用非易失性存储设备的传输。该方法进一步包括:响应于确定存储器健康状况保证存储器模块的替换,将存储器模块的存储器地址范围重新映射到专用非易失性存储设备。另一方面,提供了一种其上存储有计算机可执行指令的非瞬态计算机可读介质,该计算机可执行指令在由处理器执行时致使处理器接收计算机处理系统的多个存储器模块中的存储器模块的存储器健康状况的指示。该计算机可执行指令进一步致使处理器确定存储器健康状况是否保证存储器模块的替换。该计算机可执行指令还致使处理器响应于确定存储器健康状况保证存储器模块的替换,基于接收到存储器健康状况的指示来阻止对存储器模块的存储器地址范围的访问。该计算机可执行指令另外致使处理器响应于确定存储器健康状况保证存储器模块的替换,发起存储在存储器模块中的数据到计算机处理系统的专用非易失性存储设备的传输。该计算机可执行指令进一步致使处理器响应于确定存储器健康状况保证存储器模块的替换,将存储器模块的存储器地址范围重新映射到专用非易失性存储设备。附图简述图1是包括计算机处理器的示例性计算机处理系统的框图,该计算机处理器被配置为检测存储器健康状况并向专用非易失性存储设备传输数据以及从专用非易失性存储设备传输数据以在存储器子系统维护期间减少系统停机时间;图2A-2F是解说图1的计算机处理系统的操作的框图,该操作用于响应于存储器模块中的存储器健康状况的检测而启用“实时”存储器子系统维护;图3A-3C是解说图1的计算机处理系统的软件元件和硬件元件两者的示例性操作的流程图,该操作用于监视存储器健康状况并在存储器子系统维护期间减少系统停机时间;以及图4是可包括图1的计算机处理系统的基于处理器的示例性系统的框图。详细描述现在参照附图,描述本公开的若干示例性方面。措辞“示例性”在本文中用于表示“用作示例、实例、或解说”。本文中描述为“示例性”的任何方面不必然被解释为优于或胜过其他方面。在详细描述中公开的各方面包括在存储器子系统维护期间减少系统停机时间。还公开了相关系统、装置、方法和计算机可读介质。就此而言,在本文公开的一些示例性方面中,提供了一种用于监视存储器模块的存储器健康状况的计算机处理系统。该计算机处理系统启用存储器模块替换,而不需要使计算机处理系统脱机。作为示例,该计算机处理系统本文档来自技高网...
在计算机处理系统中存储器子系统维护期间减少系统停机时间

【技术保护点】
一种计算机处理系统,包括:多个存储器插槽,每个存储器插槽包括选通控制并被配置为与存储器模块对接;专用非易失性存储设备;以及计算机处理器,其通信地耦合到所述多个存储器插槽和所述专用非易失性存储设备;所述计算机处理器被配置为:检测与所述多个存储器插槽中的存储器插槽对接的存储器模块的存储器健康状况;将与所述多个存储器插槽中的所述存储器插槽对接的所述存储器模块标识为所述存储器健康状况的源;将存储在所述存储器模块中的数据传输到所述专用非易失性存储设备;以及使用所述存储器插槽的所述选通控制致使电压门控被施加到所述存储器插槽,以使所述存储器插槽成为不活跃。

【技术特征摘要】
【国外来华专利技术】2015.08.13 US 14/825,4951.一种计算机处理系统,包括:多个存储器插槽,每个存储器插槽包括选通控制并被配置为与存储器模块对接;专用非易失性存储设备;以及计算机处理器,其通信地耦合到所述多个存储器插槽和所述专用非易失性存储设备;所述计算机处理器被配置为:检测与所述多个存储器插槽中的存储器插槽对接的存储器模块的存储器健康状况;将与所述多个存储器插槽中的所述存储器插槽对接的所述存储器模块标识为所述存储器健康状况的源;将存储在所述存储器模块中的数据传输到所述专用非易失性存储设备;以及使用所述存储器插槽的所述选通控制致使电压门控被施加到所述存储器插槽,以使所述存储器插槽成为不活跃。2.如权利要求1所述的计算机处理系统,其特征在于,所述计算机处理器被进一步配置为使用所述存储器插槽的所述选通控制致使时钟门控被施加到所述存储器插槽。3.如权利要求1所述的计算机处理系统,其特征在于,所述计算机处理器经由高速串行设备通道被通信地耦合到所述专用非易失性存储设备。4.如权利要求3所述的计算机处理系统,其特征在于,所述高速串行设备通道被配置为根据选自包括以下各项的组的总线标准进行操作:快速外围组件互连(PCIe);串行AT附件(SATA);和快速非易失性存储器(NVMe)。5.如权利要求1所述的计算机处理系统,其特征在于:所述多个存储器插槽中的每一者进一步包括不活跃指示器;以及所述计算机处理器被进一步配置为使用所述存储器插槽的所述不活跃指示器来提供所述存储器模块不活跃的指示以促成所述存储器模块的移除。6.如权利要求1所述的计算机处理系统,其特征在于,所述计算机处理器被进一步配置为响应于所述存储器插槽接纳替换存储器模块:使用所述存储器插槽的所述选通控制,恢复对所述存储器插槽的功率;在所述替换存储器模块上执行初始化规程;以及将数据从所述专用非易失性存储设备传输到所述替换存储器模块。7.如权利要求1所述的计算机处理系统,其特征在于,所述计算机处理器被配置为通过针对与所述多个存储器插槽中的所述存储器插槽对接的所述存储器模块检测包括以下各项的组中的至少一项来检测所述存储器健康状况:可纠正的存储器错误、不可纠正的存储器错误、温度水平、电压电平、性能指示、校准值以及用户发起的升级请求,或其任何组合。8.如权利要求1所述的计算机处理系统,其特征在于,所述计算机处理器被进一步配置为在所述计算机处理系统启动处,在所述专用非易失性存储设备上执行内建自测(BIST)。9.如权利要求1所述的计算机处理系统,其特征在于,所述计算机处理系统被集成到集成电路(IC)中。10.如权利要求1所述的计算机系统,其特征在于,所述计算机系统被集成到选自包括以下各项的组中的设备中:机顶盒;娱乐单元;导航设备;通信设备;固定位置数据单元;移动位置数据单元;移动电话;蜂窝电话;计算机;便携式计算机;台式计算机;个人数字助理(PDA);监视器;计算机监视器;电视机;调谐器;无线电;卫星无线电;音乐播放器;数字音乐播放器;便携式音乐播放器;数字视频播放器;视频播放器;数字视频碟(DVD)播放器;以及便携式数字视频播放器。11.一种计算机处理系统,包括:用于检测与所述多个存储器插槽中的存储器插槽对接的存储器模块的存储器健康状况的装置;用于将与所述多个存储器插槽中的所述存储器插槽对接的所述存储器模块标识为所述存储器健康状况的源的装置;用于将存储在所述存储器模块中的数据传输到所述专用非易失性存储设备的装置;以及用于致使电压门控被施加到存储器插槽以使存储器插槽成为不活跃的装置。12.如权利要求11所述的计算机处理系统,其特征在于,进一步包括用于致使时钟门控被施加到所述存储器插槽的装置。13.如权利要求11所述的计算机处理系统,其特征在于,进一步包括用于提供所述存储器模块不活跃的指示以促成所述存储器模块的移除的装置。14.如权利要求11所述的计算机处理系统,其特征在于,进一步包括:用于响应于所述存储器插槽接纳替换存储器模块,以恢复对所述存储器插槽的所述存储器模块的功率的装置;用于在所述替换存储器模块上执行初始化规程的装置;以及用于将数据从所述专用非易失性存储设备传输到所述替换存储器模块的装置。15.如权利要求11所述的计算机处理系统,其特征在于,用于检测所述存储器健康状况的装置包括用于通过针对与所述多个存储器...

【专利技术属性】
技术研发人员:C·A·费尔南德斯J·D·亨德森M·L·霍布斯
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1