硬件故障的缓解制造技术

技术编号:9902368 阅读:128 留言:0更新日期:2014-04-10 14:04
各种示例性实施例涉及一种包含以下内容中的一个或多个的方法和相关的网络节点:资源分配设备检测服务器硬件的故障;识别被配置为利用服务器硬件的第一代理设备;以及响应于服务器硬件故障,采取至少一个动作以实现第一代理设备的重新配置。各种实施例附加地包含下列内容中的一个或多个:识别被配置为利用服务器硬件的第二代理设备;以及响应于服务器硬件故障,采取至少一个动作以实现第二代理设备的重新配置。各种实施例附加地包括下列中的一个或多个:由资源分配设备从第二代理设备接收服务器硬件故障的指示,其中第二代理设备不同于第一代理设备。

【技术实现步骤摘要】
【国外来华专利技术】硬件故障的缓解
概括地,本申请公开的各种示例性实施例涉及系统的可靠性和可用性。
技术介绍
诸如虚拟化和云计算的技术的兴起已经促使将先前与专用和独立的硬件相关联的各种应用移动到提供共享硬件资源的机器上。这种所谓的“服务器整合”允许更充分地利用可获得的资源,并且由此降低与未使用资源相关联的成本。例如,通过使先前仅轻度使用的服务器退出,可减小能耗、占地面积、和其它服务器成本。然而,独立服务器确实提供其它优势。例如,独立服务器对硬件故障提供严格的控制;如果与应用相关联的硬件出现故障,则该故障可能仅影响该应用。然而,服务器整合引入了单一硬件故障可能影响多个应用的可能性。例如,如果四个应用共享CPU,并且如果该CPU出现硬件故障,则全部四个应用可能是缺乏抵抗力并且受到不可挽救的损害。
技术实现思路
各种示例性实施例涉及一种由资源分配设备执行的方法,所述资源分配设备分配服务器资源以减轻硬件故障的影响,该方法包含下列内容中的一个或多个:资源分配设备检测服务器硬件的故障;识别被配置为利用服务器硬件的第一代理设备;以及响应于服务器硬件故障,采取至少一个动作以实现所述第一代理设备的重新配置。各种示例性实施例涉及资源分配设备,所述资源分配设备包含下列内容中的一个或多个:代理设备定义存储装置,其存储第一代理设备定义,其中所述第一代理设备定义识别第一代理设备和相关联的服务器硬件资源;硬件故障检测器,其被配置为检测所述服务器硬件资源的故障;以及代理设备保护模块,其被配置为:基于所述代理设备定义将第一代理设备识别为被配置为使用服务器硬件资源的代理设备,以及响应于服务器硬件故障,采取至少一个动作以实现所述第一代理设备的重新配置。各种示例性实施例涉及使用用于减轻硬件故障影响的指令进行编码的有形和持久的机器可读存储介质,所述有形和持久的机器可读存储介质包含下列内容中的一个或多个:用于通过资源分配设备检测服务器硬件故障的指令;用于识别被配置为利用所述服务器硬件的第一代理设备的指令;以及用于响应于所述服务器硬件故障,采取至少一个动作以实现所述第一代理设备的重新配置的指令。各种示例性实施例涉及由管理程序执行的用于减轻硬件故障影响的方法,所述方法包含下列内容中的一个或多个:管理程序检测服务器硬件故障;识别被配置为利用所述服务器硬件的第一虚拟机;以及响应于所述服务器硬件故障,采取至少一个动作以实现第一虚拟机的重新配置。各种实施例附加地包含下列内容中的一个或多个:识别与所述服务器硬件相关联的第二代理设备;以及响应于所述服务器硬件故障,采取至少一个动作以实现所述第二代理设备的重新配置。描述了各种实施例,其中检测服务器硬件故障的步骤包含:由所述资源分配设备从第二代理设备接收所述服务器硬件故障的指示,其中所述第二代理设备与所述第一代理设备不同。描述了各种实施例,其中所述至少一个动作包含:指示第二资源分配设备为所述第一代理设备分配服务器硬件资源。描述了各种实施例,其中所述至少一个动作还包含向所述第二资源分配设备发送与所述第一代理设备相关联的设备的镜像。描述了各种实施例,其中所述指示所述第二资源分配设备的步骤包含经由互联网向所述第二资源分配设备发送指示消息。描述了各种实施例,其中所述至少一个动作包含暂停所述第一代理设备的运行。描述了各种实施例,其中所述至少一个动作包含针对所述第一代理设备来仿真错误。描述了各种实施例,其中所述针对第一代理设备来仿真错误的步骤包含经由互联网向与所述代理设备相关联的设备发送错误消息。附图说明通过参照附图,以便于更好地理解各示例性实施例,其中:图1a说明了用于提供共享硬件资源的示例性系统;图1b说明了针对图1a的一些组件的替代结构;图1c说明了针对图1a的一些组件的另一种替代结构;图2说明了用于保护代理设备免受硬件故障的示例性资源分配设备;图3说明了用于存储多个代理设备定义的示例性数据结构;以及图4说明了用于保护代理设备免受硬件故障的示例性方法。为了便于理解,已经使用相同的附图标记来标出基本上具有相同或相似的结构和/或基本上具有相同或相似功能的元素。具体实施方式鉴于上述内容,希望提供一种保护共享硬件资源的代理设备免受此类资源故障的方法。特别地,希望使这些代理设备能够连续运行,且使代理设备将受到故障影响的可能性最小化。现在参照附图,公开了各种示例性实施例的宽广方面。图1a说明了用于提供共享硬件资源的示例性系统100a。示例性系统可包含多个客户端设备110a-c、网络120、资源分配设备130a-b、以及代理设备140a-d。资源分配设备130a-b和代理设备140a-d可位于在一个或多个云计算基础设施中。客户端设备110a-c每一个都可包含能够与诸如网络120的网络进行通信的任何设备。尽管这里说明了三个设备,但是示例性系统100a可包含更少或更多的设备。此外,在运行期间,参与示例性系统100a的客户端设备的数量可改变。例如,客户端设备110a可停止参与示例性系统100a,和/或其它两个客户端设备(未示出)可开始类似的参与。每个客户端设备110a-c可以是能够经由网络120与其它设备进行通信的个人计算机或膝上型计算机、终端、服务器、平板电脑、无线电子邮件设备、蜂窝电话、智能电话、电视机顶盒、或任何其它设备。每个客户端设备110a-c可以由于不同原因参与示例性系统100a。例如,客户端设备110a可以是瘦客户端,并可依赖于示例性系统内的其它资源来执行与客户端设备110a的正常运行相关的大部分或全部处理。作为另一个实施例,客户端设备110b可以是能够独立执行大部分任务的个人计算机,并可依赖于示例性系统100a内的其它资源来存储和获取数据(诸如较大的音乐或电子书集合)。作为又一实施例,客户端设备110c可以是服务器,所述服务器接收并响应于来自其它设备(未示出)的请求。当这种请求的到达速率对客户端设备110c来说太高,而不能在用于评估服务器负载的效率、响应时间或其它标准的一些测量内进行处理时,客户端设备110c可依赖于示例性系统100a中的其它资源来处理这种请求中的一部分请求。网络120可以是适用于在示例性系统100a的其它设备之间提供通信的设备或一组设备。因此,网络120可包含用于向适当的目的地转发分组的多个路由器和/或交换机。在各种实施例中,网络120可包含2G、3G和/或4G系统和/或其它无线系统中的一个或多个。此外,在各种实施例中,网络120可包含有线网络,诸如互联网和/或一个或多个局域网(LAN)。资源分配设备130a-b的每一个都可以是管理代理设备140a-d的设备。例如,资源分配设备130a可管理代理设备140a-b,且资源分配设备130b可管理代理设备140c-d。在管理这种代理设备140a-d时,资源分配设备130a-b可针对每个代理设备140a-d来分配和/或实施共享的硬件资源。例如,资源分配设备130a可确保代理设备1140a可使用第一CPU上的20%处理时间,且代理设备M140b可使用同一CPU上的10%处理时间。因此,在各种实施例中,资源分配设备130a-b的每一个都可包含管理程序。资源分配设备130a-b可执行大量附加功能,诸如,请求和响应消息路由、资源预留、负载均衡、使用计量、和/或计费。需要说明的是,尽管本文档来自技高网...
硬件故障的缓解

【技术保护点】
一种由资源分配设备执行的方法,所述资源分配设备分配服务器资源以用于减轻服务器硬件故障的影响,所述方法包括:所述资源分配设备检测(410)服务器硬件的故障;识别(415,420,435)被配置为利用所述服务器硬件的第一代理设备;以及响应于所述服务器硬件故障,采取至少一个动作(425)以实现所述第一代理设备的重新配置。

【技术特征摘要】
【国外来华专利技术】2011.08.01 US 13/195,4821.一种由资源分配设备执行的方法,所述资源分配设备分配服务器资源以用于减轻服务器硬件故障的影响,所述方法包括:所述资源分配设备检测(410)服务器硬件的故障;识别(415,420,435)被配置为利用所述服务器硬件的第一代理设备,其中第一代理设备包括虚拟设备,所述虚拟设备能够进行配置以使用不同的服务器硬件;以及响应于所述服务器硬件故障以及在所述第一代理设备受到所述服务器硬件故障的影响之前,采取至少一个动作(425)以实现所述第一代理设备的重新配置。2.根据权利要求1所述的方法,还包括:识别(415,420,435)被配置为利用所述服务器硬件的第二代理设备;以及响应于所述服务器硬件故障,采取至少一个动作(425)以实现所述第二代理设备的重新配置。3.根据权利要求1所述的方法,其中检测服务器硬件的故障的步骤包括:所述资源分配设备从第二代理设备接收所述服务器硬件的故障的指示,其中所述第二代理设备不同于所述第一代理设备。4.根据权利要求1-3中的任一项所述的方法,其中所述至少一个动作包括:指示第二资源分配设备为所述第一代理设备分配不同的服务器硬件资源。5.根据权利要求4所述的方法,其中指示所述第二资源分配设备的步骤包括经由互联网向所述第二资源分配设备发送指令消息。6.根据权利要求1-3中的任一项所述的方法,其中所述至少一个动作包括:暂停所述第一代理设备的运行。7.根据权利要求1-3中的任一项所述的方法,其中所述至少一个动作包括:针对所述第一代理设备来仿真错误。8.根据权利要求7所述的方法,其中针对所述第一代理设备来仿真错误的步骤包括:经由互联网向与所述代理设备相关联的设备发送错误消息。9.一种资源分配设备(200),包括:...

【专利技术属性】
技术研发人员:E·J·鲍尔R·S·亚当斯
申请(专利权)人:阿尔卡特朗讯公司
类型:发明
国别省市:法国;FR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1