切换装置的无缝自动回复制造方法及图纸

技术编号:15334307 阅读:143 留言:0更新日期:2017-05-16 21:36
本发明专利技术实施方式主要是涉及计算机系统的自动恢复。本技术公开可自动检测系统故障并从系统故障回复切换装置的技术。根据一些实施方式,监视计时器可检测切换系统故障并送出信号以重置切换中央处理单元。根据一些实施方式,可在重置切换中央处理单元时保持切换功能。

【技术实现步骤摘要】
切换装置的无缝自动回复
本公开整体而言涉及计算机系统的自动恢复。更精确地,技术的某些实施方式涉及一种对带有切换功能的高可用性(high-availability)的切换装置自动恢复的方法及系统。
技术介绍
网络切换器(networkswitch)是包含由系统总线连接许多元件的计算机。每个网络切换器可包含将像是以太网络的网络接口上的其他的网络装置与切换器耦接的复数个端口。网络切换器提供切换功能以在网络连接的装置之间传移信息,像是分组或数据帧。由切换器提供的切换功能通常包含自网络装置于来源端口接收数据、转移数据通过背板(backplane)至至少一另外目标端口及传送数据至网络上的另一个装置。然而,自动检测系统故障及从系统故障恢复网络切换器仍然是具有挑战性的。举例而言,当切换中央处理单元(centralprocessorunit,CPU)停摆时,通常用冷启动(coolboot)初始化以从CPU停止对输入产生回应的锁定状态中恢复切换器。然而冷启动初始化程序通常花费相对长的时间而因此降低了系统效率。
技术实现思路
本技术的各方面涉及可自动检测系统故障并从系统故障回复切换装置的手法。本技术的各方面也涉及可使切换装置自系统故障中恢复而不会妨碍切换功能的技术。根据某些实施方式,网络切换器可包含切换CPU及特定应用集成电路(Application-SpecificIntegratedCircuit,ASIC)。本技术可利用监视计时器以监控并检测切换系统故障,像是切换CPU停摆或锁定。为了应对CPU锁定,监视计时器可送出信号以重置CPU。当可配置多个监视计时器计数器时,监视计时器可在系统操作的不同阶段检测并恢复系统故障。根据某些实施方式,监视计时器可为内嵌于切换CPU中的电子计时器。根据某些实施方式,监视计时器可为独立的服务控制器,像是基板服务控制器(baseboardservicecontroller,BMC),其可以如本文所公开地实施监视计时器功能。根据某些实施方式,本技术使机架管理控制器(RackManagementController,RMC)及底板管理控制器(ChassisManagementController,CMC)能够提供监视计时器功能。根据某些实施方式,本技术涉及启动切换中央处理单元的计算机实施方法,包含:第一,设置监视计时器的第一监视计时器计数器,第一监视计时器计数器与启动载入器阶段相关联,监视计时器在第一监视计时器计数器逾期之后可操作以重置切换中央处理单元;第二,设置监视计时器的第二监视计时器计数器,第二监视计时器计数器与操作系统启动阶段相关联,监视计时器在第二监视计时器计数器逾期之后可操作以重置切换中央处理单元;以及第三,设置监视计时器的第三监视计时器计数器,第三监视计时器计数器与运行时间阶段相关联,监视计时器在第三监视计时器计数器逾期之后可操作以重置切换中央处理单元。根据某些实施方式,重置网络系统可进一步包含特定应用集成电路的暖启动初始化。与会导致网络停机时间的冷启动初始程序不同,暖启动初始程序可在CPU重置期间保存切换功能。举例而言,像是学习及转发的切换功能在CPU重置期间可继续。因此,暖启动初始化可保存切换功能的效率。根据某些实施方式,尽管本文的许多示例是参考以太网络切换器而描述的,但要理解的是其仅为示例且本技术在此方面不受限制。相反地,可使用提供计算机网络连接的任意切换器,像是光纤通道切换器、非同步传送模式(asynchronoustransfermode)切换器及InfiniBand切换器或其相似之物。此外,尽管本讨论使用BMC作为服务控制器的例子,但本技术可应用于其他独立自主CPU及操作系统的服务控制器。本公开额外的特征及优点将在下文的叙述列举,且部分将从此叙述显而易见或可借由实践本文所公开的原理来习得。本公开特征及优点可借由在附加的权利要求中特别指出的仪器及组合的方法而了解及获得。本公开的这些及其他特征将可由下列的叙述及附加的权利要求更加显而易见,或可借由实践列举于本文的原则而习得。附图说明专利技术的各种实施方式及示例公开于以下的详细描述及附图中:图1A是根据某些实施方式,说明带有内部监视计时器的自动恢复切换系统示例的示意方块图;图1B是说明带有如图1A所示的内部监视计时器的自动恢复切换系统的另一示例的示意方块图;图2是根据某些实施方式,说明带有外部监视计时器的自动恢复切换系统示例的示意方块图;图3是根据某些实施方式,自动恢复切换系统的示例流程图;图4为根据某些实施方式,带有高可用性切换功能的自动恢复切换系统的另一示例流程图;以及图5是根据某些实施方式,说明计算装置的计算平台。附图符号说明100、200:网络切换系统102、202:网络切换器104、204:存储器106、206:中央处理单元108、208、508:特定应用集成电路(ASIC)110、112、114、210、212、214:端口116、216:系统总线118、218:ASIC模块数据库120:监视计时器122、220:ASIC模块124、224:ASIC设置126:以太网络222、502:基板管理控制器302、304、306、402、404、406、408、410、412、414、416:步骤500:系统架构504:切换处理器506:输入装置510:网络接口512:显示器514:储存装置516:系统存储器524:总线具体实施方式本技术的各种实施方式在下文详述。当讨论特定的实施行为时,其应被理解为其为说明的目的进行。相关领域技术人员将认识到在不偏离本技术的精神及范围下可使用其他元件及配置。作为近代信息技术的骨干,网络切换器使多个计算装置能够经由像是以太网络的网络接口传送数据。随着不断成长的网络需求,特别是在像是大型数据中心的集群计算环境,需要网络切换器(networkswitches)以提供具有高可用性及杰出可靠性的切换功能。网络切换器通常包含中央处理单元(centralprocessingunit,CPU)及可操作的特定应用集成电路(application-specificintegratedcircuit,ASIC)以提供数据切换功能。一般而言,冷启动初始化通常用来从CPU锁定状态(lock-up)中恢复切换器,在CPU锁定状态中,CPU停止对输入产生回应。冷启动初始程序通常花费相对长的时间以恢复切换器,因而导致切换功能的低可用性。因此,具有提供切换系统故障的自动检测及恢复的网络切换器协议的改良需求。进一步地说,需要不妨碍切换功能地恢复网络切换器。本技术公开了可利用监视计时器(watchdogtimer)而具备自动检测并恢复切换系统故障可行的技术。根据某些实施方式,本技术可利用内嵌在切换CPU中的监视计时器提供本文公开的监视功能;根据某些实施方式,本技术可利用于切换CPU外部的服务控制器提供本文公开的监视功能。根据某些实施方式,本技术能够无缝恢复网络切换器而不会降低像是数据帧(dataframes)的学习、溢流及转发的切换功能。监视计时器(watchdogtimer)可为用以检测并恢复系统故障的电子式计时器。监视计时器通常以可自起始值计数至零的计数器为基础,其可触发系统重置。当系统操作为正常时,系统可本文档来自技高网...
切换装置的无缝自动回复

【技术保护点】
一种启动切换中央处理单元的计算机实施方法,其包含:设置一监视计时器的一第一监视计时器计数器,该第一监视计时器计数器与一启动载入器阶段相关联,该监视计时器在该第一监视计时器计数器逾期之后可操作以重置一切换中央处理单元;设置该监视计时器的一第二监视计时器计数器,该第二监视计时器计数器与一操作系统启动阶段相关联,该监视计时器在该第二监视计时器计数器逾期之后可操作以重置该切换中央处理单元;以及设置该监视计时器的一第三监视计时器计数器,该第三监视计时器计数器与一运行时间阶段相关联,该监视计时器在该第三监视计时器计数器逾期之后可操作以重置该切换中央处理单元。

【技术特征摘要】
2015.11.04 US 14/932,3521.一种启动切换中央处理单元的计算机实施方法,其包含:设置一监视计时器的一第一监视计时器计数器,该第一监视计时器计数器与一启动载入器阶段相关联,该监视计时器在该第一监视计时器计数器逾期之后可操作以重置一切换中央处理单元;设置该监视计时器的一第二监视计时器计数器,该第二监视计时器计数器与一操作系统启动阶段相关联,该监视计时器在该第二监视计时器计数器逾期之后可操作以重置该切换中央处理单元;以及设置该监视计时器的一第三监视计时器计数器,该第三监视计时器计数器与一运行时间阶段相关联,该监视计时器在该第三监视计时器计数器逾期之后可操作以重置该切换中央处理单元。2.如权利要求1所述的方法,其中该第一监视计时器计数器是根据与该启动载入器阶段相关联的一预期时间而设置。3.如权利要求1所述的方法,其中该第二监视计时器计数器是根据与该操作系统启动阶段相关联的一预期时间而设置。4.如权利要求1所述的方法,其中该第三监视计时器是借由一监视计时器常驻程序而周期性地重置,以防止该第三监视计时器逾期,该监视计时器常驻程序与一切换中央处理单元的操作状态相关联。5.如权利要求1所述的方法,其中该监视计时器是在该切换中央处理单元中的一内嵌式计时器或在该切换中央处理单元外部的一服务控制器。6.如权利要求1所述的方法,其进一步包含行使下述其中之一:在该第一监视计时器计数器逾期后,在该启动载入器阶段中重置该切换中央处理单元;在该第二监视计时器计数器逾期后,在该操作系统启动阶段中重置该切换中央处理单元;以及在该第三监视计时器计数器逾期后,在该运行时间阶段中重置该切换中央处理单元。7.一种网络切换系统,其包含:一处理器;以及一存储装置,包含指令,当该处理器执行指令时,使处理器行使指令...

【专利技术属性】
技术研发人员:赖德贤黄楹钦陈念青蔡碧月
申请(专利权)人:广达电脑股份有限公司
类型:发明
国别省市:中国台湾,71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1