用于在信息处理系统中管理存储错误的系统和方法技术方案

技术编号:2819599 阅读:201 留言:0更新日期:2012-04-11 18:40
公开了一种用于在POST阶段以及在单处理器和多处理器信息处理系统中存储器校准的期间处理存储缺陷的方法,由此关于已知存储缺陷的位置的信息被用以优化信息处理系统的性能。在系统存储器中的存储缺陷被识别并且在操作期间被没有错误的存储空间替代。

【技术实现步骤摘要】

本专利技术一般涉及计算机系统和信息处理系统领域,并且尤其涉及处理存储错误(memory error)。
技术介绍
随着信息的价值和使用不断地增加,个人和企业均在寻求其它的处理和 存储信息的方法。对于用户而言, 一个可用的选择就是信息处理系统。信息 处理系统通常处理、汇集、存储和/或传输用于商业、个人或者其他目的的信 息和数据,从而使用户得以利用信息的价值。由于不同的用户或应用之间存 在不同的技术和信息处理需要和需求,因此信息处理系统在以下方面可能不 同信息处理的类型;处理信息的方法;处理、存储或传输信息的方法;所 处理、存储或传输的信息量;以及处理、存储或传输信息的速度和效率方面。 信息处理系统中的变化允许信息处理系统成为通用的、或者针对特定用户或 者诸如金融交易处理、航班订票、企业数据存储或者全球通信的特定用途而 被配置。另外,信息处理系统可以包含或包括多种被配置为处理、存储和传 输信息的软硬组件,并且可以包含一个或者多个计算机系统、数据存储系统 和网络系统。计算系统通常将包括某些形式的临时信息存储介质,例如随机存取存储 器。在最新的计算系统中,信息处理系统所包含的存储量可以是千兆字节级 的。随着存储大小的增加,存储部分可能被制造得存在缺陷或者随着时间地 过去而变得存在缺陷的可能性也在急剧增大。如果放任不理,不管缺陷存储 单元有多大,缺陷存储单元的存在能导致信息处理系统出现故障,该故障能 够引起信息处理系统的当前操作的突然终止,从而导致重要数据的丢失或可以阻止信息处理系统的完全启动。随着计算系统不断地发展和计算机技术的进步,CPU和存储器之间的操作关系变得更加重要。现代系统的许多属性(特别是多核处理器和虚拟化的全面引入)导致了不断增长的存储占用量(footprint)。因此,不仅仅系统存 储器逐渐变成整体解决方案成本的相当大的部分,而且存储器中的错误行为 的影响会对计算系统的相关寿命周期费用产生更加坏的影响。通常,嵌入的错误校正策略成功地被用于避免在单比特上的"冲突(crash)"并且被用来检测多比特恶化(corruption)。然而,随着存储器体积 的变小以及存储容量的增大,有必要增加服务保护的另一个标准,该标准是 迅速可用的并且常驻在它自己的存储模块中。PC结构中系统的成功运行依 赖于某些存储区域没有缺陷。例如,甚至在包括128GB存储器的高级处理 器系统中,如中断矢量地址、基本输入/输出系统("BIOS")数据区域以及 在F000:0地址空间的64KB区域的某些存储区域不包括缺陷是至关重要的。 存在许多被用来追踪或用来指示存在已知存储错误的各种方法。因此, 在缺陷的或损坏的存储块的存在和状况是已知的实例中,可以容忍存储缺陷(memory defect)的早期BIOS加电自检("POST")过程变得有必要。特别 地,尽管存在已知的存储缺陷,但期待允许POST过程在没有冲突的情况下 成功地完成POST初始化过程。
技术实现思路
根据本专利技术的内容,公开了一种用于在单个处理器和多处理器信息处理 系统中的POST阶段和存储器校准期间处理存储缺陷的方法,由此关于已知 存储缺陷的位置的信息被利用以优化信息处理信息的性能。本专利技术的技术优点在于其通过在不损害系统性能的情况下允许具有已 知存储缺陷的存储组件的使用,从而大幅降低了信息处理系统的成本。识别并存储存储缺陷信息的能力允许具有部分有缺陷的存储组件的信息处理系 统在没有"冲突"的情况下操作。特别地,信息处理系统在它绕过有缺陷的存 储单元时保持可操作性,并且当新的缺陷出现时更新它的存储缺陷信息。随 着系统存储器逐渐成为了整个解决方案成本的相当大的部分,所述改进之处 的重要性也得到了扩大。本专利技术的另一个技术优点在于其允许系统保持正常工作而不管系统存 储器中的较小的缺陷。通过最小化错误的存储器行为的影响,根据本专利技术的 系统和方法可以大幅降低信息处理系统的相关的寿命周期费用。通过阅读以 下说明书、权利要求书和附图,其他技术优点对本领域技术人员而言将显而 易见。附图说明通过参考以下结合附图的描述,可以获得对本实施方式及其优点的更加 透彻的理解,附图中,相同的参考数字表示相似的特征,其中 图1是传统的信息处理系统的框图2是在具有非一致性随机存储器访问结构的服务器中处理存储缺陷的 步骤的流程图3是在双列直插式存储模块(Dual In-line Memory Module)校准时处 理存储缺陷的流程图4是具有缺陷区域的示例的存储模块的流程图5是在分配用于POST任务使用的存储器时处理存储缺陷的步骤流程图。具体实施例方式针对本公开的目的,信息处理系统可以包括任何手段或者手段的集合,所述手段用于计算、分类、处理、发送、接收、获取、创建、交换、存储、 显示、显现、检测、记录、复制、操作、或者利用任何形式的用于商业、科 学、控制或者其他目的的信息、智能、或者数据。例如,信息处理系统可以 为个人计算机、网络存储设备或者其他合适的设备,并且可以在大小、形状、 性能、功能和价格上有所不同。所述信息处理系统可以包括随机存取存储器(RAM)、 一个或者多个诸如中央处理单元(CPU)或者硬件或软件控制逻 辑的处理资源、ROM、和/或其他类型的非易失性存储器。所述信息处理系 统的附加组件可以包括一个或者多个磁盘驱动器、 一个或者多个与外部设备 进行通信的网络端口、以及各种输入和输出(I/O)设备,例如键盘、鼠标 和视频显示器。所述信息处理系统还可以包括一个或者多个用于在所述各种 硬件组件之间发送通信信息的总线。图1中示出了一般的信息处理系统的框图。所述一般的信息处理系统5 的处理器或CPU 100以通信的方式连接到存储控制器中心或北桥芯片(north bridge) 102。存储控制器中心102连接到存储器104和图形处理单元106。 存储控制器中心102还连接到I/0控制中心或南桥(south bridge) 108。 I/O 控制中心108连接到计算机系统的存储元件,该存储元件包括诸如用于计算 机系统的BIOS的闪存ROM的存储元件110和计算机系统的硬盘驱动器 112。 I/O控制中心108还可以连接到新一代I/O芯片114,该芯片114自身 连接到计算机系统的多个I/0端口, 1/0端口包括键盘116、鼠标118和并行 端口 120。在图2中,在具有非一致性存储器访问(NUMA)结构的处理器中用于 处理存储缺陷的步骤的流程图由参考数字200表示。在NUMA系统中,每 个处理器有自己本地映射的存储器。另外,每个处理器也可以访问连接在其 它处理器的存储器,该存储器作为远程的存储器被映射在处理器上。典型地, 一个在NUMA结构中的处理器被指定为默认启动服务处理器(BSP)。默认 启动服务处理器的指定可以作为系统硬件配置的部分或可以通过软件功能被选择或修改。BIOS初始从默认启动服务处理器运行。在步骤202,处理POST过程期间,BIOS在每个存储段上寻找并且定位 缺陷存储块。下一步,在步骤204,默认启动服务处理器被选定作为处理器, 该处理器的存储器将被进行存储缺陷分析。在步骤206,确定默认启动服务 处理器的存储段是否有任何缺陷存储块。如果没有,在步骤208默认启动处 理器将仍然是启本文档来自技高网
...

【技术保护点】
一种在多处理器系统中处理存储错误的方法,该方法包括: 在存储段中定位缺陷存储块,其中每个存储段对应一个处理器; 选择与具有预定可接受水平的缺陷存储块的所述存储段相对应的处理器;以及 指定所选择的处理器作为启动服务处理器。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:MP哈尔特里PD斯塔尔茨FE诺罗德JD派克
申请(专利权)人:戴尔产品有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利