当前位置: 首页 > 专利查询>英特尔公司专利>正文

利用存储器控制器处理数据错误事件的方法、装置和系统制造方法及图纸

技术编号:14682758 阅读:97 留言:0更新日期:2017-02-22 16:07
用于提供针对包括存储器的平台的错误检测和校正的技术和机制,所述存储器包括一个或多个备用存储器分段。在实施例中,存储器控制器执行第一清洗操作,其包括检测多个当前活动存储器分段中的错误。针对一个或多个存储器分段执行额外的巡检清洗,同时存储器分段中的每个可用于激活作为替代存储器分段。在另一实施例中,如果基于活动分段清洗检测到不可校正的错误事件,则用信号通知第一处理程序过程(但不是第二处理程序过程);而如果基于备用分段清洗检测到不可校正的错误事件,则用信号通知第二处理程序过程(但不是第一处理程序过程)。在第一处理程序过程和第二处理程序过程当中,仅用信号通知第一处理程序过程导致平台的崩溃事件。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术的实施例总体上涉及计算机存储器领域,并且更具体地但非排它地涉及处理在存储器设备中的错误。
技术介绍
在现今的计算世界中,维持好的计算机系统可靠性和工作时间通常是重要的甚至是强制性的。为了维持重大的计算机工作时间,系统设计者建立了可靠性、可用性、可服务性、可管理性(RASM)特征,以改善整体系统可靠性和可用性。因此,通常的是发现在这种系统中不同级别处采用的各种冗余程度、错误校正、错误检测和错误包含技术。计算机系统故障的最常见类型之一归因于系统存储器错误。存储器设备易受例如暂态(或软)错误之类的错误的影响。如果这些错误不被正确处理,则它们可能会引起计算系统故障。因此,存储器子系统(尤其是双列直插式存储器模块或DIMM)对此受到特别的注意。例如,纠错码(ECC)形式的冗余信息或其它这种纠错信息可以用于存储器清洗操作,以改善整体的系统可靠性。需求存储器清洗是一种错误检测/校正技术,其中可以在操作过程中检测存储器分段中的错误(无论是一位或多位错误),以服务主机操作系统的请求来访问存储器分段。通过对比,已知为巡检存储器清洗的另一RASM技术针对之前的错误前摄地扫描存储器分段,或者以其他方式不依赖于任何这种主机操作系统请求来访问存储器分段而扫描存储器分段。另一RAS技术(已知为“存储器备用”)在使用中的(或者“活动的”)存储器分段发生实际的或预期的未来错误时分配一个或多个存储器分段,每个存储器分段作为备用分段可用于服务。当误差检测或其它机制指示在使用中的存储器分段的这种故障时,备用存储器分段被分配为充当已故障的/正发生故障的分段的后继(替代)。将系统存储器映射更新到与后续分段的存储器位置相关联的地址,例如,地址范围,其中先前的这种地址被映射以多方面地识别已故障的/正发生故障的活动分段的相应位置。附图说明通过示例而非限制的方式在附图的图中示出了本专利技术的各个实施例,其中:图1是根据实施例示出用于提供对存储器分段的访问的计算机平台的元件的功能框图。图2是根据实施例示出用于用信号通知存储器错误事件的存储器控制器的元件的功能框图。图3是根据实施例示出用于调用操作来处理存储器错误事件的方法的元素的流程图。图4A、4B是根据实施例分别示出用于处理存储器错误事件的方法的元素的流程图。图4C是根据实施例示出执行的存储器分段分配的元件的功能框图。图5A、5B是根据实施例分别示出用于处理存储器错误事件的方法的元素的流程图。图5C是根据实施例示出执行的存储器分段分配的元件的功能框图。图6是根据实施例示出用于控制存储器的计算机系统的元件的功能框图。图7是根据实施例示出用于控制存储器的移动平台的元件的功能框图。具体实施方式这里讨论的实施例多方面地提供了在包括一个或多个备用存储器分段的平台中的错误检测。如本文所使用的,“存储器分段”指的是在一个或多个方面可以独立于类似的存储器硬件单元而操作的存储器硬件的单元。存储器分段可以包括排(rank)、组(bank)或其它存储器硬件部件,例如,其中所述部件包括多个不同寻址的存储器位置。存储器分段可以包括或耦合到专用于通过在该分段和存储器控制器之间耦合的总线或其它互连只耦合到该分段而不是一个或多个其它存储器分段的接口硬件。可替代地或另外地,存储器分段可以包括专用芯片支持输入、地址解码器或其它逻辑。本文关于针对各个存储器排的各种实现存储器清洗和/或存储器备用讨论了特定实施例的特征。然而,这种讨论可以扩展为额外地或可替代地施加到任意各种其它类型的存储器分段。例如,可以基于主机操作系统(OS)或其它代理当前是否能够访问给定存储器分段,而将所述存储器分段分类为活动的或备用的。备用分段可用于最终激活以充当已经被识别为已故障分段或正发生故障分段的另一存储器分段的替代。为了简洁起见,这种分段在本文中被称作“已故障/正发生故障的”。可以根据不同实施例而多方面地执行清洗操作以检测(以及在一些实施例中,校正)在存储器的一个或多个分段中的错误。特定实施例并不局限于通过其来多方面地计算、存储和后续取回ECC或其它这种误差校正信息以用于执行个体错误检测计算的特定方式。这些方式的特定细节采纳传统的误差检测/校正技术和机制,并不在此进行讨论以避免模糊这些实施例的特征。可以基于占位符数据(以及对应的错误校正信息),来执行备用存储器分段的清洗,存储器控制器和/或存储器设备可以例如独立于主机OS或其它请求者代理而将所述占位符数据例如存储到备用存储器分段中。在备用存储器分段的这种清洗期间,备用分段可能对主机OS或访问当前活动的存储器分段的其它这种请求者代理不可见(例如,未向其登记)。虽然现代存储器采用纠错码(ECC)来检测和/或校正单位和双位错误,但是更高阶多位错误仍对系统可靠性和可用性产生了重要的问题。错误检测机制通常包括用于将错误分类为可校正错误或不可校正错误之一的功能。常规的错误处理技术通过发起对操作系统的机器检查操作,而多方面地响应于存储器中的不可校正错误。这种操作包括执行系统范围的关机。一般而言,常规存储器清洗技术甚至不支持清洗备用存储器,更不用说提供针对活动分段和备用分段的不同的各种错误处理机制。相比之下,特定实施例提供基于与检测出的错误事件相关联的存储器分段当前是被指定活动分段还是备用分段来用信号通知不同的处理程序过程。例如,针对活动分段检测的错误可以导致机器检查异常或异常处理程序的其它这种调用。相比之下,与备用分段相关联的错误事件可以导致用信号通知不同类型的事件处理程序(例如,中断处理程序)。在实施例中,备用分段错误事件导致在处理器的系统管理模式期间执行的事件处理操作,例如,然而活动分段错误事件反而可以导致在处理器的不同模式期间由主机OS执行的操作。另外或可替代地,活动分段错误事件可以导致引起平台范围的重置、崩溃或其它这种“蓝屏”事件的事件处理操作。备用分段错误事件可以反而允许完成事件处理操作,而不依赖于重新启动或以其它方式重启平台执行软件的任何需要。图1示出了根据实施例实现的系统100的元件。系统100表示任意数量的计算系统,例如,包括服务器、台式计算机、膝上型计算机、移动设备、智能电话、游戏设备等,其可以多方面地支持错误检测功能和存储器备用功能,如本文所讨论的。系统100可以包括存储器子系统120,其经由一个或多个数据、命令、地址和/或其它信号线(如图示互连125表示)耦合到存储器控制器110,例如,当存储器控制器110至少部分地控制在请求者和存储器子系统120之间的信息转移。例如,这种请求者可以是处理器150(例如,中央处理单元、图形处理器、服务处理器、处理器核心和/或其它),或者可替代地可以是输入/输出设备(例如,快速外围部件互连(PCI)设备)、存储器本身、或者是系统100的请求访问存储器的任意其它元件。在一些实施例中,存储器控制器110处于与包括请求者的集成电路(IC)管芯相同的集成电路(IC)管芯上。存储器子系统120可以包括多种类型的存储器分段中的任一种,例如,其具有各自的存储器单元行,其中可经由字线或等价物访问数据。在一个实施例中,存储器子系统120包括动态随机存取存储器(DRAM)技术,例如其根据双数据速率(DDR)规范、低电力DDR(LPDDR)规范或其它这种本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/58/201480077247.html" title="利用存储器控制器处理数据错误事件的方法、装置和系统原文来自X技术">利用存储器控制器处理数据错误事件的方法、装置和系统</a>

【技术保护点】
一种存储器控制器,包括:清洗器逻辑,其包括这样的电路:其执行存储器的多个活动分段的第一巡检清洗,并执行平台的一个或多个分段的第二巡检清洗,同时所述一个或多个分段中的每一个能够用作所述多个活动分段的备用分段;以及备用器逻辑,其包括这样的电路:其接收基于所述第一巡检清洗所检测到的第一不可校正的错误事件的指示,其中,在第一处理程序过程和第二处理程序过程当中,所述备用器逻辑响应于所述第一不可校正的错误事件的指示,仅用信号通知所述第一处理程序过程;所述备用器逻辑还接收基于所述第二巡检清洗所检测到的第二不可校正的错误事件的指示,其中,在第一处理程序过程和第二处理程序过程当中,所述备用器逻辑响应于所述第二不可校正的错误事件的指示,仅用信号通知所述第二处理程序过程。

【技术特征摘要】
【国外来华专利技术】1.一种存储器控制器,包括:清洗器逻辑,其包括这样的电路:其执行存储器的多个活动分段的第一巡检清洗,并执行平台的一个或多个分段的第二巡检清洗,同时所述一个或多个分段中的每一个能够用作所述多个活动分段的备用分段;以及备用器逻辑,其包括这样的电路:其接收基于所述第一巡检清洗所检测到的第一不可校正的错误事件的指示,其中,在第一处理程序过程和第二处理程序过程当中,所述备用器逻辑响应于所述第一不可校正的错误事件的指示,仅用信号通知所述第一处理程序过程;所述备用器逻辑还接收基于所述第二巡检清洗所检测到的第二不可校正的错误事件的指示,其中,在第一处理程序过程和第二处理程序过程当中,所述备用器逻辑响应于所述第二不可校正的错误事件的指示,仅用信号通知所述第二处理程序过程。2.根据权利要求1所述的存储器控制器,其中,所述第一处理程序过程包括机器检查异常处理程序。3.根据权利要求1所述的存储器控制器,其中,所述第二处理程序过程包括中断处理程序。4.根据权利要求1所述的存储器控制器,其中,所述第二处理程序过程登记替换存储器设备的服务请求。5.根据权利要求1所述的存储器控制器,其中,所述第一处理程序过程是在主机操作系统执行期间由处理器执行的,并且其中,所述第二处理程序过程是在所述处理器的系统管理模式期间执行的。6.根据权利要求1所述的存储器控制器,所述备用器逻辑进一步用于:如果基于所述第一巡检清洗检测到阈值可校正错误事件,则用信号通知不同于所述第一过程的处理程序过程,其中,响应于所述阈值可校正错误事件而用信号通知的任意处理程序过程是不同于所述第一处理程序过程的处理程序过程。7.根据权利要求6所述的存储器控制器,其中,所述备用器逻辑用信号通知不同于所述第一过程的处理程序过程包括:所述备用器逻辑用信号通知在处理器的系统管理模式期间执行的处理程序过程。8.一种方法,包括:执行存储器的多个活动分段的第一巡检清洗;如果基于所述第一巡检清洗检测到不可校正的错误事件,则用信号通知第一处理程序过程,其中,在所述第一处理程序过程和第二处理程序过程当中,响应于由所述第一巡检清洗检测到的所述不可校正的错误事件,仅用信号通知所述第一处理程序过程;执行所述存储器的一个或多个分段的第二巡检清洗,同时所述一个或多个分段中的每一个能够用作所述多个活动分段的备用分段;以及如果基于所述第二巡检清洗检测到不可校正的错误事件,则用信号通知所述第二处理程序过程,其中,在所述第一处理程序过程和第二处理程序过程当中,响应于由所述第一巡检清洗检测到的所述不可校正的错误事件,仅用信号通知所述第一处理程序过程。9.根据权利要求8所述的方法,其中,所述第一处理程序过程包括机器检查异常处理程序。10.根据权利要求8所述的方法,其中,所述第二处理程序过程包括中断处理程序。11.根据权利要求8所述的方法,其中,所述第二处理程序过程登记替换存储器设备的服务请求。12.根据权利要求8所述的方法,其中,所述第一处理程序过程是在主机操作系统执行期间由处理器执行的,并且其中,所述第二处理程序过程是在所述处理器的系统管理模式期间执行的。13.根据权利要求8所述的方法,还包括:如果基于所述第一巡检清洗检测到阈值可校正错误事件,则用信号通知不同于所述第一过程的处理程序过程,其中,响应于所述阈值可校正错误事件而用信号通知的任意处理程序过程是不同于所述第一处理程序过程的处理程序过程。14.根据权利要求13所述的方法,其...

【专利技术属性】
技术研发人员:A·阿格拉瓦尔S·姆蒂亚卢陈英文M·加内桑
申请(专利权)人:英特尔公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1