自动硬件恢复方法及自动硬件恢复系统技术方案

技术编号:14061261 阅读:76 留言:0更新日期:2016-11-27 18:11
自动硬件恢复方法及自动硬件恢复系统。在一些例子中,系统可接收关联一节点的快速外围组件互连装置的装置失效的通知。系统也可接收用以断开快速外围组件互连装置与节点之间的链接的第一请求、及用以将替换快速外围组件互连装置于断开链接后与此节点连接的第二请求。此系统可以接着重配置快速外围组件互连切换结构以断开快速外围组件互连装置与节点之间的链接,并将替换快速外围组件互连装置与此节点连接。

【技术实现步骤摘要】

本专利技术涉及硬件恢复,具体而言,涉及自动硬件恢复系统。
技术介绍
计算机的效能及处理能力于近数十年来有巨大且稳定的成长。不足为奇地,计算系统,譬如服务器,已越来越复杂,其通常配备越来越多的数量及类型的组件,譬如处理器、存储器和附加卡。大部分专家同意此趋势将持续至未来。然而,随着硬件组件的数量及复杂度成长,计算系统越来越易于遭受装置失效。确实,装置失效是系统管理员所面对的普遍常见的问题,尤其是在较大、较复杂的环境及架构中,譬如数据中心及解集架构(例如Rack Scale Architecture等)。不幸的是,装置失效可以是非常具有破坏性的。例如,长时间的装置失效可破坏计算或网络服务,且有时候甚至会导致数据遗失。为了改正装置的失效,系统管理员通常必须执行手动的硬件恢复过程。此硬件恢复过程可包括关闭系统或服务的电源以替换失效的系统组件。整体恢复过程可以是无效率的,且可能导致对使用者意义重大的服务上的破坏。此外,仰赖于使用者输入来完成恢复过程上的某些步骤会进一步延迟系统的恢复并致使对使用者来说更大的破坏。
技术实现思路
本揭示文件的附加特征及优点将阐述于随后的说明内容中,且部分于说明内容将是明显的、或可藉由在此公开的原理的实行所习得。本揭示文件的附加特征及优点可藉由附加的权利要求中特别指出的手段或组合来理解和取得。本揭示文件的附加特征及其他特征将自随后的说明内容及附加的权利要求中更加完全显现、或可由此处阐述的原理的实行所习得。此处阐述的方法可以用以执行自动系统恢复。例如,此处阐述的方法可以在多种环境及架构中执行自动系统硬件恢复,包括解集的架构。自动系统<br/>恢复可限制或除去使用者手动输入的需求且可大大减少使用者所经历的例如硬件失效造成的任何破坏。此外,自动系统恢复可实施于支持快速外围组件互连(PCIe)热插拔、通用串行总线(USB)热插拔的架构、以及不支持热插拔程序的架构。本揭示文件公开用于自动硬件恢复的系统、方法、及非暂时性计算机可读存储介质。在一些配置中,系统可接收关联一节点的装置的装置失效的通知,此装置譬如为快速外围组件互连或任何类型的具有热插拔能力的装置。装置失效可以是装置的硬件和/或软件失效。此外,此装置包括任何组件或扩展卡,譬如网络接口卡(NIC)、存储装置(例如固态硬盘)、图形处理单元(GPU)等。接着,系统可接收用以断开装置(例如PCIe装置)与节点之间的链接的第一请求、及用以将替换装置(例如PCIe替换装置)于断开链接后与此节点连接的第二请求。基于第一及第二请求,系统可接着重配置装置切换结构(例如PCIe switch fabric)以断开此装置与此节点之间的链接,并将替换装置与此节点连接。附图说明为了描述使上文记述和本揭示文件的其他优点及特征能被了解的方式,在上文简短描述的原理的更详细描述将藉由此处绘示于附加图示的具体实施例的参考来提供。应理解图式仅描绘本专利技术的示范实施例,并不用以限制专利技术范围,本文原理通过随附的图式的使用,以附加特性及细节来描述及解释:图1A~图1B绘示示例系统实施例;图2A绘示示例快速外围组件互连系统支持热插拔操作的方块图;图2B绘示在快速外围组件互连系统中不藉由使用者输入的热插拔操作的示例过程的方块图;图2C绘示在快速外围组件互连系统中不藉由使用者输入或控制器的热插拔操作的示例过程的方块图;图3A绘示自动硬件恢复的示例架构的示意图;图3B绘示在示例架构中用于自动恢复的热插拔机制的示意方块图;图3C绘示在示例架构中用于自动恢复的热调换机制的示意方块图;图4绘示用以执行自动恢复程序的示例方法;图5绘示用以执行热新增程序的示例方法;以及图6绘示用以执行热移除程序的示例方法。【符号说明】100、150、200、312、314、316、318:系统102:总线104:存储器106:只读存储器108:随机存取存储器110、138:控制器112:存储装置114~118:模块120:输入装置122:输出装置124:通信接口126:传感器128:快取130:处理器132:快闪存储器134、162:固件136:显示器152:芯片组、硬件组件154:桥接器156:接口组件158:通信接口160:处理器、硬件组件164:输出装置、硬件组件166:存储装置168:存储器、存储装置、硬件组件202:控制器204:根端口206:电源控制模块208:金属氧化物半导体场效晶体管210:扩展槽212:按钮214:保留闩216、218:指示灯220、222、226、230、232、234、254、256、266:信号224、258:电源故障状况228:输入250、270:过程252:硬件组成管理器260:注意按压按钮输入(说明书无)262:手动操作保留闩(说明书无)264:保留指示灯(说明书无)300:架构302:切换结构304:结构控制器306:硬件监控系统310:网络装置322:基本输入/输出系统、BIOS324:操作系统、OS326:装置集区328:装置330:链接400、500、600:方法402、404、406、502、504、506、508、510、512、602、604、606、608、610、612:步骤具体实施方式本揭示文件的各种实施例于下文作详细地讨论。当讨论特定的实施方式时,应理解其仅用于说明的目的。本领域技术人员将了解到其他组件及配置
可在不背离本专利技术的精神及范围的情况下被使用。本揭示文件公开用于自动硬件恢复的系统、方法、及非暂时性计算机可读存储介质。用于自动硬件恢复的示例系统及配置的简短介绍描述首先于此公开。包括例子及变化例的自动硬件恢复的详细描述将随后提出。应作为不同实施例来描述的此等变化例被阐述。请参阅图1A和图1B。图1A和图1B绘示示例系统实施例。当实行本专利技术技术时,更多适当的实施例对于本领域技术人员是易见的。本领域技术人员将易于理解到其他系统实施例是可行的。图1A绘示系统总线计算系统架构(系统100),其中系统的组件使用总线102与彼此电性通信。示例系统100包括处理器130(CPU或处理器)及将各个系统组件耦接至处理器130的系统总线102,此等系统组件包括系统存储器104,譬如只读存储器106(ROM)及随机存取存储器108(RAM)。系统100可包括高速存储器的快取,此高速存储器直接与处理器130连接、或位于处理器130的近处、或整合作为处理器130的部分。系统100可自存储器104和/或存储装置112复制数据至快取128以供处理器130来快速存取。在此方式中,快取可提供性能提升以避免处理器130在等待数据时延迟。此些或其他模块可控制或被配置来控制处理器130来执行不同操作。其他系统存储器104同样可供使用。存储器104可包括多个不同类型的具有不同性能特性的存储器。处理器130可包括任何一般目的处理器及配置以控制处理器130和特殊目的处理器的硬件模块或软件模块,譬如存储装置112中的模块一114、模块二116、和模块三118,其中软件指令整合至实际处理器设计中。处理器130实质上可为完全自足式计算系统,包含多个内核或处理器、总线、存储器控制器、快取等。多内核处理器可为对称或非对称。为了致使与系统100的使用者互动,输入装置120可本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201610307717.html" title="自动硬件恢复方法及自动硬件恢复系统原文来自X技术">自动硬件恢复方法及自动硬件恢复系统</a>

【技术保护点】
一种自动硬件恢复方法,包含:藉由结构控制器接收与一节点连接的快速外围组件互连装置的一装置故障的通知;藉由该结构控制器接收第一请求,该第一请求用以断开该快速外围组件互连装置与该节点之间的链接;藉由该结构控制器接收第二请求,该第二请求用以将替换快速外围组件互连装置与该节点连接;以及藉由该结构控制器重新配置快速外围组件互连切换结构,藉以:断开该快速外围组件互连装置与该节点间的该链接;以及将该替换快速外围组件互连装置与该节点连接。

【技术特征摘要】
2015.05.11 US 14/708,857;2015.12.30 US 62/272,815;1.一种自动硬件恢复方法,包含:藉由结构控制器接收与一节点连接的快速外围组件互连装置的一装置故障的通知;藉由该结构控制器接收第一请求,该第一请求用以断开该快速外围组件互连装置与该节点之间的链接;藉由该结构控制器接收第二请求,该第二请求用以将替换快速外围组件互连装置与该节点连接;以及藉由该结构控制器重新配置快速外围组件互连切换结构,藉以:断开该快速外围组件互连装置与该节点间的该链接;以及将该替换快速外围组件互连装置与该节点连接。2.如权利要求1所述的自动硬件恢复方法,进一步包含:检测该节点上该快速外围组件互连装置的该装置故障,其中该装置故障是由基板管理控制器、基本输入输出系统及操作系统中至少一个所检测;基于该装置故障,藉由该基板管理控制器接收第三请求以执行快速外围组件互连装置热插拔装置移除程序;藉由该基板管理控制器经由快速外围组件互连装置热插拔信号,发送该快速外围组件互连装置将从该节点被移除的通知至该操作系统;以及藉由该基板管理控制器自该操作系统接收该快速外围组件互连装置已被移除的通知。3.如权利要求2所述的自动硬件恢复方法,进一步包含:藉由该基板管理控制器接收第四请求以执行快速外围组件互连热插拔装置插入程序;响应该第四请求,藉由该基板管理控制器经由控制快速外围组件互连热插拔信号,发送该替换快速外围组件互连装置将被连接至该节点的通知给该操作系统;以及藉由该基板管理控制器接收来自该操作系统的该替换快速外围组件互连装置已被连接的通知。4.如权利要求1所述的自动硬件恢复方法,进一步包含:藉由关联于该节点的基板管理控制器接收该替换快速外围组件互连装置
\t已被连接至关联于该节点的插槽的通知;藉由该基板管理控制器模拟存在检测接脚或暂存器以指示该替换快速外围组件互连装置已被连接至关联于该节点的该插槽;藉由该基板管理控制器模拟手动操作保留闩的关闭;以及基于关联于注意按钮的...

【专利技术属性】
技术研发人员:施青志
申请(专利权)人:广达电脑股份有限公司
类型:发明
国别省市:中国台湾;71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1