台式计算机刀片故障识别系统和方法技术方案

技术编号:3545248 阅读:189 留言:0更新日期:2012-04-11 18:40
一种用于对耦合到计算机网络的计算机网络设备中的故障进行远程地隔离的方法和系统。多个第一计算机单元耦合到该计算机网络。该多个第一计算机单元位于计算机网络的用户端。多个第二计算机单元耦合到该计算机网络。该多个第二计算机单元位于网络的服务提供商端。该多个第二计算机单元中的一个被指定向该多个第一计算机单元中的一个提供计算服务。经历与它的所被指定的第二计算机单元进行故障通信的该多个第一计算机单元中的一个使用多个第一计算机单元中的另一个作为代理计算机单元以远程地隔离故障。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及台式刀片计算机系统,并且特别地涉及一种用于识别并隔 离在系统内发生的故障的台式计算机刀片系统和方法。
技术介绍
通过服务器刀片技术来固定硬件和服务器应用位置的逐渐普及已经导 致台式刀片系统的发展。与将服务器固定在服务器刀片系统中不一样,台 式刀片系统故意将用户与"台式"处理单元分开。例如,典型的台式刀片 系统在计算机房间或区域中包括一个或多个机架,每个机架都具有一个或多个安装于其中的"刀片"也即"刀片中心(bladecenter)"。刀片中心 中的每个刀片都是被分派(allocate)给用户并提供相同功能的处理单元, 如同该处理单元就位于用户的桌子上。在用户的桌子处向用户提供小型桌 端(deskside) i殳备,其提供针对显示单元和诸如键盘、鼠标和USB端口 之类的接口设备的接口 。桌端设备通常通过使用公知的组网技术诸如以太 网来硬连线到刀片中心或耦合到刀片中心。使用以太网和因特网协议("IP")作为例子,视频和键盘/鼠标信息 经由路由器/交换机从桌端单元穿过IP网络行进到刀片中心中的台式处理 器。将这些设备经由IP网络并在距离上分开增加了许多故障点,这些故障 点在台式处理器位于用户位置处并直接连接到外围设备的传统台式计算机 安装中不存在。更特别地,在台式刀片环境中,故障点包括网络、桌端单 元和台式处理器刀片(和/或刀片中心)。结果,如果存在问题则用户无法 容易地帮助进行问题性质的识别并且没有任何与刀片中心进行通信的途 径。作为上述缺点的结果,当前的台式刀片系统的实现需要对桌端单元进 行耗时和昂贵的访问以识别并校正问题。而且,在此期间,用户不能使用他们的计算机,因此影响了生产力。因此,理想的是具有一种可允许系统 自己识别故障问题的源并且采取自主校正动作的台式刀片系统和方法。在 不能釆取自主校正动作的情况下,诸如在需要技术人员来访问例如桌端单 元的非冗余硬件的故障时可能出现的那样,理想的是具有一种隔离故障的 系统和方法。
技术实现思路
在第一方面,本专利技术提供了一种用于对耦合到计算机网络的计算机网络设备中的故障进行远程地隔离的系统,该系统包括多个耦合到该计算 机网络的第一计算机单元,多个第一计算机单元位于计算机网络的用户端; 以及多个耦合到该计算机网络的第二计算机单元,多个第二计算机单元位 于网络的服务提供商端,多个第二计算机单元中的一个被指定向多个第一 计算机单元中的一个提供计算服务;其中经历与它的所被指定的第二计算 机单元进行故障通信的多个第一计算机单元中的一个使用多个第 一计算机 单元中的另 一个作为代理计算机单元以远程地隔离故障。该系统可以进一步包括刀片中心,其中多个第 一计算机单元是在台式 刀片系统中的桌端单元而多个第二计算机单元是被包括为刀片中心的 一部 分的台式刀片。优选地,经历与它的所被指定的台式刀片进行故障通信的桌端单元指 示刀片中心对分配给经历故障的桌端单元的台式刀片进行诊断测试,如果 分配给经历故障的桌端单元的台式刀片通过了诊断测试,则刀片中心重启 分配给经历故障的桌端单元的台式刀片,如果分配给经历故障的桌端单元 的台式刀片诊断测试失败,则刀片中心分配另 一个台式刀片给经历故障的 桌端单元。优选地,刀片中心指示代理桌端单元将包传输给经历故障的桌端单元, 该包包括指示是否已经重启了原先所分配的台式刀片或者是否已经分配了 另一个台式刀片的数据。优选地,代理桌端单元未从经历故障的桌端单元接收到确认数据包被 收到的响应,代理桌端单元对经历故障的桌端单元执什珍断测试以进一步隔离故障。优选地,如果经历故障的桌端单元通过了诊断测试,则确定通信网 络在经历故障的桌端单元与刀片中心之间的一点处已经发生故障;报告故 障;并且经历故障的桌端单元使用另 一个桌端单元来与分配给经历故障的 桌端单元的台式刀片进行通信;以及如果经历故障的桌端单元诊断测试失 败,则确定经历故障的桌端单元有故障并且报告故障。优选地,经历与它的所指定的台式刀片的故障通信的桌端单元使用 UDP协议和注册类广播协议中的一种来与代理桌端单元进行通信以指示 刀片中心对分配给经历故障的桌端单元的台式刀片进行诊断测试。在第二方面,提供了 一种用于对耦合到计算机网络的计算机网络设备 中的故障进行远程地隔离的方法,该计算机网络设备包括多个耦合到该 计算机网络的第 一计算机单元,多个第 一计算机单元位于计算机网络的用 户端;以及多个耦合到该计算机网络的第二计算机单元,多个第二计算机 单元位于该网络的服务提供商端,多个第二计算机单元中的一个被指定向多个第一计算机单元中的一个提供计算服务;该方法包括确定多个第一 计算机单元中的一个正经历着与它的所被指定的第二计算机单元的故障通信;以及使用多个第一计算机单元中的另 一个作为代理计算机单元以远程 地隔离故障。优选地,多个第一计算机单元是台式刀片系统中的桌端单元而多个第 二计算机单元是被包括为刀片中心的一部分的台式刀片。优选地,使用多个第一计算机单元中的另一个作为代理计算机单元来 对故障进行远程地隔离包括指示刀片中心对分配给经历故障的桌端单元 的台式刀片进行i貪断测试,如果分配给经历故障的桌端单元的台式刀片通 过了诊断测试则重启分配给经历故障的桌端单元的台式刀片;并且如果分 配给经历故障的桌端单元的台式刀片诊断测试失败则将另 一个台式刀片分 配给经历故障的桌端单元。优选地,使用多个第一计算机单元中的另一个作为代理计算机单元来 对故障进行远程地隔离进一步包括指示代理桌端单元将包传输给经历故 障的桌端单元,该包包括指示是否已经重启了原先所分配的台式刀片或者是否已经分配了另 一个台式刀片的数据。优选地,使用多个第一计算机单元中的另一个作为代理计算机单元来对故障进行远程地隔离进一步包括如果代理桌端单元未从经历故障的桌 端单元接收到确认数据包被收到的响应,则对经历故障的桌端单元执行诊 断测试以进一步隔离故障。优选地,如果经历故障的桌端单元通过了诊断测试,则使用多个第一 计算机单元中的另 一个作为代理计算机单元来对故障进行远程地隔离进一步包括确定通信网络在经历故障的桌端单元与刀片中心之间的一点处已 经发生故障;报告故障;并让经历故障的桌端单元使用另一个桌端单元来 与分配给经历故障的桌端单元的台式刀片进行通信;并且其中,如果经历 故障的桌端单元诊断测试失败,则用多个第一计算机单元中的另 一个作为 代理计算机单元来对故障进行远程地隔离进一步包括确定经历故障的桌 端有故障;并"^艮告故障。优选地,经历与它的所被指定的台式刀片的故障通信的桌端单元使用 UDP协议和注册类广播协议中的一个来与代理桌端单元进行通信以指示 刀片中心对分配给经历故障的桌端单元的台式刀片进行诊断测试。在第三个方面,提供了一种计算机程序,包括计算机程序代码以在被 加载进计算机系统中并在其上被执行时使得所述计算机执行根据第二方面 的方法的步骤。可以以机器可读存储设备的形式来提供计算机程序代码,所述机器可 读存储设备已在其上存储了用于对耦合到计算机网络的计算机网络i殳备中 的故障进行远程地隔离的计算机程序,该计算机网络设备包括多个耦合 到计算机网络的第 一计算机单元,多个第 一计算机单元位于计算机网络的 用户端;以及多个耦合到计算机网络的第二本文档来自技高网
...

【技术保护点】
一种用于对耦合到计算机网络的计算机网络设备中的故障进行远程地隔离的系统,所述系统包括:多个耦合到所述计算机网络的第一计算机单元,所述多个第一计算机单元位于计算机网络的用户端;以及多个耦合到所述计算机网络的第二计算机单元,所述 多个第二计算机单元位于网络的服务提供商端,所述多个第二计算机单元中的一个被指定向所述多个第一计算机单元中的一个提供计算服务;其中经历与它的所被指定的第二计算机单元进行故障通信的所述多个第一计算机单元中的一个使用所述多个第一计算机单元 中的另一个作为代理计算机单元以远程地隔离所述故障。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:DC克罗默HJ洛克RS斯普林菲尔德RD瓦尔特曼
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利