数据处理系统以及用于监视数据处理系统的方法技术方案

技术编号:2857963 阅读:136 留言:0更新日期:2012-04-11 18:40
本申请涉及数据处理系统以及用于监视数据处理系统的方法。具体地,本发明专利技术提供了一种系统、方法和计算机程序产品,用于监视能够从数据处理系统的空闲资源池分配给数据处理系统的不同分区的资源。一个空闲资源事件记录与空闲资源池相关联,用于保存空闲资源池中的每一个资源的事件记录。当一个资源从空闲资源池被分配给一个分区时,所分配资源的事件记录就从空闲资源事件记录转移到与该分区相关联的事件记录。

【技术实现步骤摘要】

本专利技术总体上涉及数据处理领域,尤其涉及用于监视能够从数据处理系统的空闲资源池中被分配给数据处理系统的不同分区的资源的系统、方法和计算机程序产品。
技术介绍
越来越多地,大型的对称多处理器数据处理系统不再是被用作单个的大型数据处理系统,而是被分区,用作多个较小的系统。这些系统通常被称为逻辑分区(LPAR,logical partitioned)数据处理系统。一个数据处理系统内的逻辑分区功能允许单个操作系统的多个拷贝或者多个异类操作系统在单个数据处理系统平台上同时运行。平台资源的一个不重叠子集被分配给其中运行一个操作系统的一个分区。这些平台资源可以包括一个或者多个不同架构的处理器,各有自己的中断管理区、系统存储区以及输入输出(I/O)适配器总线插槽。分区的资源由平台的固件提供给操作系统。在一个平台内运行的每一个操作系统都受到保护不受其它操作系统的影响,从而一个逻辑分区中的软件错误不会影响任意其它分区中的正确操作。通过分配平台资源的要由每一个操作系统直接管理的不相交集合,并提供保证各操作系统不能控制没有分配给该系统的资源的机制,提供这种保护。另外,防止在控制操作系统的分配资源时的软件错误影响任意其它操作系统的资源。这样,每一个操作系统直接控制平台内的可分配资源的一个独立集合。对于逻辑分区数据处理系统中的硬件资源,这些资源在各分区之间是被不相交地共享的。硬件资源例如可以包括输入输出(I/O)适配器、存储器DIMM、非易失性随机存取存储器(NVRAM)以及硬盘驱动器。在自主数据处理系统中,例如在动态逻辑分区(DLPAR)数据处理系统或者处理能力按需动态升级(DCUoD,Dynamic CapacityUpgrade on Demand)数据处理系统中,可分配资源经常在空闲资源池和逻辑分区之间移动,以满足分区的动态工作负荷的要求。自主计算的一个重要方面是服务器自我修复的能力。实现自我修复的一种技术是数据处理系统用来自可用资源池的类似资源,或者用按需升级处理能力的资源(capacity upgrade on demand resource),来替代预计要失效的资源。失效预测一般是通过分析与每一个资源相关联的错误记录实现的。实现数据处理系统的这种自我修复功能的一个问题在于,当资源在分区和空闲资源池之间移动时,也就是当资源在资源被分配给某个分区的状态和资源没有被分配给某个分区但是在需要时可用于分配的状态之间移动时,系统不能监视对某个资源记录的有关错误。尤其是,当一个资源从第一分区移动到空闲资源池,然后再被分配给第二分区时,在第一分区中时可能对该资源记录到的错误会丢失。如果与资源的故障预测有关的错误在该资源被分配给第一分区时被记录在该分区中,则当该资源被分配给第二分区时可能会意想不到地出现故障,这是因为对于第二分区中的预测故障分析(Predictive Failure Analysis(PFA)),无法考虑当被分配给第一分区时针对该资源记录的错误。因此,希望能够精确地监视能够从数据处理系统的空闲资源池被分配给数据处理系统的不同分区的资源。
技术实现思路
本专利技术提供了一种系统、方法和计算机程序产品,用于监视能够从数据处理系统的空闲资源池被分配给数据处理系统的不同分区的资源。一个空闲资源事件记录与空闲资源池相关联,用于维护空闲资源池中的每一个资源的事件的记录。当一个资源从空闲资源池被分配给一个分区时,所分配资源的事件的记录就从空闲资源事件记录转移到与该分区相关联的事件记录。本专利技术允许针对预测故障分析以及其它目的,精确地监视能够从数据处理系统的空闲资源池被分配给数据处理系统的不同分区的资源。附图说明在所附的权利要求中给出了被认为是本专利技术的特点的新颖特征。但是,本专利技术本身以及其使用的最优模式,以及其它的目的和优点,要在结合附图阅读对说明性实施例的详细说明之后才能得到最好的理解。附图中图1是可以实现本专利技术的数据处理系统的框图;图2是可以实现本专利技术的举例的逻辑分区平台的框图;图3A、3B和3C的示意图简要地图示了一种已知的用于监视能够从数据处理系统的空闲资源池被分配给数据处理系统的不同分区的资源的方法,用于帮助解释本专利技术;图4A、4B和4C的示意图简要地图示了本专利技术的优选实施例的一种用于监视能够从数据处理系统的空闲资源池被分配给数据处理系统的不同分区的资源的方法;图5的流程示了本专利技术的优选实施例的一种用于监视从数据处理系统的一个分区转移到空闲资源池的资源的方法;图6的流程示了本专利技术的优选实施例的一种用于监视从数据处理系统的空闲资源池被分配到一个分区的资源的方法。具体实施例方式现在看附图,图1图示了可以实现本专利技术的数据处理系统的框图。数据处理系统100可以是包括连接到系统总线106的多个处理器101、102、103和104的对称多处理器(SMP)系统。连接到系统总线106的还有存储器控制器/高速缓存108,其提供到多个本地存储器160-163的接口。I/O总线桥110连接到系统总线106,提供到I/O总线112的接口。存储器控制器/高速缓存108和I/O总线桥110可以如图所示集成在一起。数据处理系统100是一个逻辑分区(logical partitioned(LPAR))数据处理系统。因此,数据处理系统100可以具有多个同时运行的异类操作系统(或者单个操作系统的多个实例)。这些操作系统都可具有在其中执行的任意数量的软件程序。数据处理系统100被逻辑分区,使得不同的PCI I/O适配器120-121、128-129以及136、图形适配器148和硬盘适配器149可以被分配给不同的逻辑分区。在此例中,图形适配器148为显示设备(未图示)提供连接,而硬盘适配器149提供控制硬盘150的连接。这样,例如,假设数据处理系统100被分为三个逻辑分区P1、P2和P3。每一个PCI I/O适配器120-121、128-129、36、图形适配器148、硬盘适配器149,每一个主处理器101-104,以及来自本地存储器160-163的存储器,被分配给这三个分区中的每一个。在这些例子中,存储器160-163可以是双列直插存储器模块(DIMM)。DIMM一般不是按每个DIMM被分配给各分区。相反,一个分区可以获得平台所见的总存储空间的一部分。例如,处理器101、来自本地存储器160-163的存储空间的某些部分以及I/O适配器120、128和129可以被分配给逻辑分区P1;处理器102-103、来自本地存储器160-163的存储空间的某些部分以及PCI I/O适配器121和136可以被分配给逻辑分区P2;处理器104、来自本地存储器160-163的存储空间的某些部分、图形适配器148以及硬盘适配器149可以被分配给逻辑分区P3。在数据处理系统100内执行的每一个操作系统被分配给不同的逻辑分区。这样,在数据处理系统100内执行的每一个操作系统只可以访问在其逻辑分区内的I/O单元。这样,例如,高级交互执行(AIX)操作系统的一个实例可以在分区P1内执行,AIX操作系统的第二实例(镜像)可以在分区P2内执行,LINUX或者OS/400操作系统可以在逻辑分区P3内工作。连接到I/O总线112的外设部件互连(PCI)主桥(host bridge)114提供本文档来自技高网
...

【技术保护点】
一种数据处理系统,包括:多个分区;空闲资源池;至少一个能够从所述空闲资源池被分配给所述多个分区中的任何分区的资源;以及与所述空闲资源池相关联的空闲资源事件记录,用于保存所述空闲资源池中的所述至少一个资源中的每 个资源的事件记录。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:法萨尔M阿瓦达乔内森布朗菲利普伯纳德布克斯小维克托艾克斯皮诺扎
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1