计算系统中的存储器备份管理技术方案

技术编号:19396769 阅读:18 留言:0更新日期:2018-11-10 05:02
本文公开了计算设备中的存储器备份管理和相关联的操作方法的各实施例。在一个实施例中,一种管理存储器备份的方法包括响应于检测到系统错误,使得存储器控制器与和具有易失性存储器模块和非易失性存储器模块的混合存储器设备通信以及控制该混合存储器设备脱离。该方法还可以包括使得混合存储器设备在存储器控制器与和存储设备通信以及控制存储设备脱离之后将数据从易失性存储器模块复制到非易失性存储器模块,而不操作主处理器和存储器控制器。

【技术实现步骤摘要】
【国外来华专利技术】计算系统中的存储器备份管理背景云计算数据中心中的服务器可以利用非易失性双列直插内存模块(“NVDIMM”)或其他混合存储器设备来实现高应用性能、良好的数据安全性和较低的系统崩溃恢复时间。某些类型的NVDIMM(例如,NVDIMM-N)可以包括可操作地耦合到闪存模块的动态随机存取存储器(“DRAM”)模块。DRAM模块允许快速存储器访问,而闪存模块可以在意外断电、系统崩溃或正常系统关闭时持续保留数据。概述提供本概述以便以简化的形式介绍以下在详细描述中进一步描述的一些概念。本概述并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。在某些计算设备中,NVDIMM中的数据备份和持久性操作在很大程度上依赖于其他主板组件的可用性。例如,当服务器遇到系统错误时,服务器的主处理器可指示相应的存储器控制器刷新存储器控制器的缓冲器并将仍在缓冲器中的任何数据写入NVDIMM。然后,存储器控制器可命令NVDIMM在服务器向NVDIMM上的输入引脚(例如,SAVE#引脚)提供信号(例如,电压信号)之前切换到自刷新模式,以在NVDIMM中启动数据备份。信号可以是单次上升,单次下降或其他合适类型的信号。响应于所提供的信号,NVDIMM然后可在从NVDIMM移除电力之前将数据从DRAM模块复制并持久地存储到相应的闪存模块。当遇到某些系统故障或错误时,上述数据备份和持久性操作可能存在数据丢失的高风险。例如,处理器和/或存储器控制器中的致命错误可中断上述备份操作。中断可阻止NVDIMM进入自刷新模式,从而阻止从DRAM模块到闪存模块的数据备份的启动。因此,由于缺乏刷新,当前驻留在DRAM模块中的数据可能会丢失。这种数据丢失会违反NVDIMM的数据持久性保证。所公开的技术的若干实施例可通过针对NVDIMM或其他类型的混合存储器设备中的数据备份和持久性而言消除或至少减少对主处理器和/或存储器控制器的依赖来减少在系统故障期间的这种数据丢失的风险。例如,根据所公开技术的实施例的计算设备(例如,服务器)可包括位于存储器控制器和NVDIMM之间的通信总线(例如,I2C总线)中的开关(例如,I2C开关)。该开关被配置为可控制地使存储器控制器与NVDIMM脱离。开关还可将NVDIMM接合到计算设备的基板管理控制器(“BMC”)。随后,BMC可通过经由I2C总线传送命令使NVDIMM启动备份和持久性操作,或者可以向NVDIMM上的SAVE#引脚提供信号。因此,主处理器或存储器控制器中的致命错误不会阻止DRAM模块中的数据备份和持久存储到NVDIMM的闪存模块。BMC通常比主处理器更可靠,因为BMC是监视计算设备的物理状态的专用服务处理器,而不被赋予执行各种计算或逻辑操作的任务。因此,所公开的技术的若干实施例可通过利用BMC来启动和/或监视NVDIMM中的数据备份和持久性来提高计算设备的性能和可靠性。在其他实施例中,BMC还可被配置为监视NVDIMM的备份和持久操作的状态。基于所监视的备份操作的状态,BMC然后可允许计算设备在成功完成备份操作时重置。在在备份操作期间发生错误的情况下,还可以将BMC配置为在例如用于诊断的系统错误日志中创建条目。在进一步的实施例中,开关可被配置为将NVDIMM接合到机架控制器或其他合适类型的控制器以代替BMC。然后,机架控制器或其他合适类型的控制器可执行本文关于BMC描述的各种操作。附图简述图1是示出根据本技术的实施例的具有配置有存储器备份管理的计算单元的计算系统的示意性框图。图2A-2D是根据本技术的实施例的适用于各种操作模式中的图1中的计算系统的计算单元的示意性框图。图3是示出根据本技术的实施例的适合于图2A-2D的基板管理控制器的软件模块的框图。图4是示出根据本技术的实施例的用于管理存储器备份的过程的流程图。图5是示出根据本技术的实施例的用于执行数据备份的过程的流程图。详细描述以下描述了与管理存储器备份相关的计算系统、设备、组件、模块、例程和过程的各种实施例。在以下描述中,包括了示例软件代码、值、和其他具体细节以提供对本技术的各个实施例的全面理解。本领域技术人员也将理解该技术可具有另外的实施例。该技术也可以在没有下面参考图1-5描述的实施例的若干细节的情况下实施。如本文中所使用的,术语“易失性存储器”通常是指需要电力来维持存储的数据的计算机存储器。易失性存储器的一个示例是DRAM,其可以在上电时通过刷新来保留存储的数据。当电源被移除或中断时,DRAM模块可能由于缺乏刷新而快速丢失存储的数据。相反,术语“非易失性存储器”通常是指即使没有电力也能保留存储的数据的计算机存储器。非易失性存储器的示例包括只读存储器(“ROM”)、闪存(例如,NAND或NOR固态驱动器)和磁存储设备(例如,硬盘驱动器)。如还在本文中使用的,术语“混合存储器”通常是指包含可操作地彼此耦合的易失性存储器和非易失性存储器的计算机存储器。在某些实现中,易失性存储器可以由例如计算设备的主处理器使用,而非易失性存储器主要或专门用于促进或确保易失性存储器中的内容看起来是持久的。因此,当在操作期间意外地丢失电力时,易失性存储器中的内容不会丢失。混合存储器的一个示例是一种NVDIMM(例如,NVDIMM-N)。在至少一些实现中,NVDIMM可以包括可操作地彼此耦合的DRAM和闪存。NVDIMM设备还可以包括模块控制器,该模块控制器被配置为管理DRAM、闪存的操作以及它们之间的操作。尽管本文中的描述使用NVDIMM作为混合存储器设备的示例,但是所公开的技术的实施例也可被实现为其他合适类型的混合存储器设备。在某些计算系统中,由于快速数据访问、高数据安全性和低系统崩溃恢复时间,混合存储器设备(例如,NVDIMM)被用于数据存储。然而,混合存储器设备中的数据的备份和持久性通常依赖于主处理器、存储器控制器和/或计算设备的其他组件的可用性。例如,当主处理器和/或存储器控制器经历致命错误时,该依赖可能存在数据丢失的风险。这种数据丢失会对用户体验产生负面影响并降低计算设备的性能。所公开的技术的若干实施例可通过针对混合存储器设备中的数据备份和持久性而言消除或至少减少对主处理器和/或存储器控制器的依赖来至少降低混合存储器设备中的这种数据丢失的风险。因此,主处理器和/或存储器控制器中的致命错误不会阻止或中断混合存储器设备中的数据的备份和持久性,如下面参考图1-5更详细地描述的。图1是示出根据本技术的实施例的具有配置有存储器备份管理的计算单元的计算系统100的示意性框图。如图1所示,计算系统100可包括多个计算机机箱102,其分别容纳由计算机网络108经由网络设备106互连的多个计算单元104。计算机网络108还可被配置为将各个计算单元104与一个或多个客户端设备103互连(出于说明目的仅示出一个)。尽管图1中示出了计算系统100的特定配置,但是在其他实施例中,计算系统100还可以包括电源、冷却系统、电源备份系统和/或其他合适的组件。计算机机箱102可包括具有合适形状和大小的结构以容纳计算单元104.例如,计算机机箱102可包括机架、抽屉、容器、机柜和/或其他合适的组件。在图1所示的实施例中,为了说明的目的,在每个计算机机箱102中示出了四本文档来自技高网...

【技术保护点】
1.一种管理计算设备中存储器备份的方法,所述计算设备具有主处理器和通过数据总线可操作地耦合到混合存储器设备的存储器控制器,所述混合存储器设备具有易失性存储器模块、非易失性存储器模块以及可操作地耦合到所述易失性存储器模块和所述非易失性存储器模块的模块控制器,所述方法包括:监视所述计算设备中的系统错误;以及响应于系统错误被检测到,使得所述存储器控制器与和所述混合存储器设备通信以及控制所述混合存储器设备脱离;以及在所述存储器控制器与和所述混合存储器设备通信以及控制所述混合存储器设备脱离之后,使得所述混合存储器设备的所述模块控制器将数据从所述易失性存储器模块复制到所述非易失性存储器模块并在所述混合存储器设备的所述非易失性存储器模块中持久存储来自所述易失性存储器模块的经复制的数据,而不操作所述主处理器或所述存储器控制器。

【技术特征摘要】
【国外来华专利技术】2016.03.11 US 15/067,6441.一种管理计算设备中存储器备份的方法,所述计算设备具有主处理器和通过数据总线可操作地耦合到混合存储器设备的存储器控制器,所述混合存储器设备具有易失性存储器模块、非易失性存储器模块以及可操作地耦合到所述易失性存储器模块和所述非易失性存储器模块的模块控制器,所述方法包括:监视所述计算设备中的系统错误;以及响应于系统错误被检测到,使得所述存储器控制器与和所述混合存储器设备通信以及控制所述混合存储器设备脱离;以及在所述存储器控制器与和所述混合存储器设备通信以及控制所述混合存储器设备脱离之后,使得所述混合存储器设备的所述模块控制器将数据从所述易失性存储器模块复制到所述非易失性存储器模块并在所述混合存储器设备的所述非易失性存储器模块中持久存储来自所述易失性存储器模块的经复制的数据,而不操作所述主处理器或所述存储器控制器。2.如权利要求1所述的方法,其特征在于,还包括在将所述存储器控制器脱离之后,使得所述混合存储器设备进入自刷新模式,在所述自刷新模式中,所述混合存储器设备从可操作地耦合到所述混合存储器设备的辅助电源接收电力,所述辅助电源与所述计算设备的主电源分离。3.如权利要求1所述的方法,其特征在于,进一步包括:在将所述存储器控制器脱离之后,使得所述混合存储器设备进入自刷新模式,在所述自刷新模式中,所述混合存储器设备从可操作地耦合到所述混合存储器设备并与所述计算设备的主电源分离的辅助电源接收电力;以及其中使得所述混合存储器设备复制数据包括使得所述混合存储器设备在所述混合存储器设备处于所述自刷新模式之后将数据从所述易失性存储器模块复制到所述非易失性存储器模块。4.如权利要求1所述的方法,其特征在于,使得所述存储器控制器脱离包括激活所述数据总线上的开关以将所述存储器控制器与和所述混合存储器设备通信以及控制所述混合存储器设备脱离。5.如权利要求1所述的方法,其特征在于:使得所述存储器控制器脱离包括激活所述数据总线上的开关以将所述存储器控制器与和所述混合存储器设备通信以及控制所述混合存储器设备脱离;以及使得所述混合存储器设备复制数据...

【专利技术属性】
技术研发人员:M·A·肖S·CC·李S·戈文丹B·凯利
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1