【技术实现步骤摘要】
本专利技术涉及服务器系统技术。
技术介绍
现今服务器的运算速度较之前快速。服务器系统典型地包括软硬件元件、应用程序(application program)、操作系统(operating system)、处理器、总线及存储器的组合。每个服务器依赖物理存储器(例如:动态随机存取存储器(DRAM))进行处理。除了处理器以外,存储器是服务器中最影响效能关键(performance-critical)资源的一个元件且是整个服务器硬件花费中重要的一部分。存储器模块通常和服务器中系统板上的处理器匹配。当在系统板上的处理器越来越多时,需要更多的存储器模块以容纳处理器数目增加的处理需求。然而,存储器模块数量的增加也会增加服务器上的存储器错误率。这可是代表着一个重大的花费增加。因此,有需要增强服务器系统中的存储器的容错率。
技术实现思路
本专利技术各种实施例中的系统和方法提供一种前述问题的解决方案,此解决方案借由遮蔽(mask)存储器装置中被检测到的多个不良晶片(die)所对应的物理存储器地址,用以增强服务器系统中的存储器容错率。仔细而言,本专利技术中各个不同的实施例提供多个方法,用以测试在服务器系统中的一个或多个存储器装置是否有任何存储器错误,并且记录一个或多个存储器装置中检测到的存储器错误所对应的物理存储器地址,以及禁止检测到的存储器错误所对应的物理存储器地址被操作系统、应用程序及/或服务器系统的其他元件存取。在传统的服务器系统中,当存储器装置中检测到一存储器错误或一不良晶片时,整个存储器装置必须被物理地(physically)移除并以新的存
储器装置取代 ...
【技术保护点】
一种服务器系统,包括:至少一处理器;以及一存储器装置,包括多个指令,当上述指令被上述至少一处理器所执行时,使得上述服务器系统进行下列步骤:检测在上述服务器系统的至少一存储器装置中的至少一存储器错误;当检测到上述至少一存储器错误时,决定上述服务器系统中的一目前的存储器拓扑;当上述目前的存储器拓扑相较于一先前的存储器拓扑并无改变时,将与上述至少一存储器错误相关的一信息载入至一存储器遮蔽清单,上述信息包括与上述至少一存储器错误相关的多个物理存储器地址;以及禁止上述至少一存储器装置中的上述物理存储器地址被上述服务器系统的软件元件或其他硬件元件所存取。
【技术特征摘要】
2014.11.14 US 14/542,3551.一种服务器系统,包括:至少一处理器;以及一存储器装置,包括多个指令,当上述指令被上述至少一处理器所执行时,使得上述服务器系统进行下列步骤:检测在上述服务器系统的至少一存储器装置中的至少一存储器错误;当检测到上述至少一存储器错误时,决定上述服务器系统中的一目前的存储器拓扑;当上述目前的存储器拓扑相较于一先前的存储器拓扑并无改变时,将与上述至少一存储器错误相关的一信息载入至一存储器遮蔽清单,上述信息包括与上述至少一存储器错误相关的多个物理存储器地址;以及禁止上述至少一存储器装置中的上述物理存储器地址被上述服务器系统的软件元件或其他硬件元件所存取。2.如权利要求1所述的服务器系统,其中上述服务器系统包括一个或多个节点,上述一个或多个节点中的每个节点包括一基板管理控制器、一基本输入输出系统和一服务器,上述服务器至少包括一处理器,上述基板管理控制器用于管理一对应节点上的服务器系统软件与多个硬件元件间的一接口,且当上述指令被执行时,还使得上述服务器系统进行下列步骤:当上述服务器系统中的一节点的上述软件元件与硬件元件的至少一参数超出与上述节点的一潜在性错误所相关的一预设极限时,借由上述基板管理控制器通过一网络传送一警示至上述服务器系统中的一微控制器或一系统管理员。3.如权利要求1所述的服务器系统,其中上述服务器系统包括一存储器测试元件,上述存储器测试元件用以比较来自至少一存储器装置中的数据与一参考数据,且至少根据一比较结果,决定在上述至少一存储器装置中是否发生上述存储器错误。4.如权利要求3所述的服务器系统,其中当上述指令被执行时,还使得上述服务器系统进行下列步骤:写入一数据至上述至少一存储器装置;从上述至少一存储器装置读取上述数据;比较所写入的上述数据与从上述至少一存储器装置中所读取的数据;以及当上述所读取的数据中的至少一者不同于所写入的上述数据时,指出上述存储器错误已发生。5.如权利要求3所述的服务器系统,其中当上述指令被执行时,还使得上述服务器系统进行下列步骤:写入一数据至上述至少一存储器装置;从上述至少一存储器装置读取上述数据;比较从上述至少一存储器装置中所读取的数据;以及当从上述至少一存储器装置之一者所读取的数据不同于从上述至少一存储器装置的另一者所读取的数据时,指出上述存储器错误已发生。6.如权利要求1所述的服务器系统,其中上述目前的存储器拓扑包括上述服务器中至少一存储器控制器和上述至少一存储器装置之间的连接信息。7.如权利要求1所述的服务器系统,其中当上述指令被执行时,还使得上述服务器系统进行下列步骤:于上述存储器遮蔽清单中,增加一预定范围的物理存储器地址,上述预定范围的物理存储器地址相邻于上述存储器错误所对应的上述物理存储器地址;以及禁止上述至少一存储器装置中的上述预定范围的物理存储器地址被上述服务器系统的上述软件元件与上述硬件元件所存取。8.如权利要求1所述的服务器系统,其中当上述指令被执行时,还使得上述服务器系统进行下列步骤:于上述存储器遮蔽清单中,增加上述存储器错误所对应的一个或多个晶片的多个物理存储器地址和上述一个或多个晶片的至少一邻近晶片的多个物理存储器地址;以及禁止对应于上述存储器错误的上述一个或多个晶片的物理存储器地址和上述至少一邻近晶片的物理存储器地址被上述服务器系统的上述软件元件与上述硬件元件所存取。9.如权利要求1所述的服务器系统,其中当上述指令被执行时,还使得上述服务器系统进行下列步骤:动态保留上述至少一存储器装置的至少一部分做为一保留存储器,用以
\t复制上述至少一存储器装置所存储的数据;以及当对应于上述存储器错误的上述物理存储器地址被禁止存取时,从上述保留存储器中取回对应于上述物理存储器地址的数据。10.如权利要求1所述的服务器系统,其中上述服务器系统还包括一个或多个节点,上述一个或多个节点中的每个节点包含一基本输入输出系统,用以初始化或至少部分地测试上述至少一存...
【专利技术属性】
技术研发人员:苏美琳,王玮群,钱威宇,
申请(专利权)人:广达电脑股份有限公司,
类型:发明
国别省市:中国台湾;71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。