【技术实现步骤摘要】
服务器硬件故障修复方法和装置
本申请涉及云技术,更具体地涉及一种用于服务器群组的服务器硬件故障修复方法、装置、设备以及存储介质。
技术介绍
在服务器的运营生命周期中,当执行业务的服务器出现故障或即将出现故障时,存在需要对故障的服务器进行整机置换的需求。置换后的服务器与原先使用的服务器具有相同的业务数据和业务属性。在传统的解决方案中,为了实现服务器的整机置换,需要联系厂商进行上门检修和维护,这需要数个小时甚至几天的耗时。在故障服务器需要执行任务的情况下,这样的故障修复耗时将严重影响用户的使用体验。为此,需要提供一种更快速的硬件故障修复方法。
技术实现思路
根据本申请的一方面,提出了一种用于服务器群组的服务器硬件故障修复方法,其中所述服务器群组中的服务器存储用于执行任务的数据,包括:接收所述服务器群组中的服务器故障信息,所述服务器故障信息指示所述服务器群组中的特定服务器出现硬件故障;响应于所述服务器故障信息,获取所述特定服务器的配置参数,并获取多个备用服务器的配置参数及操作状态;基于所述多个备用服务器的操作状 ...
【技术保护点】
1.一种用于服务器群组的服务器硬件故障修复方法,其中所述服务器群组中的服务器存储用于执行任务的数据,包括:/n接收所述服务器群组中的服务器故障信息,所述服务器故障信息指示所述服务器群组中的特定服务器出现硬件故障;/n响应于所述服务器故障信息,获取所述特定服务器的配置参数,并获取多个备用服务器的配置参数及操作状态;/n基于所述多个备用服务器的操作状态,在多个备用服务器中确定用于替换所述特定服务器的候选替换服务器;/n基于所述特定服务器的配置参数与所述候选替换服务器的配置参数,在所述候选替换服务器中确定匹配所述特定服务器的替换服务器;/n输出用于将所述特定服务器中存储的用于执行 ...
【技术特征摘要】
1.一种用于服务器群组的服务器硬件故障修复方法,其中所述服务器群组中的服务器存储用于执行任务的数据,包括:
接收所述服务器群组中的服务器故障信息,所述服务器故障信息指示所述服务器群组中的特定服务器出现硬件故障;
响应于所述服务器故障信息,获取所述特定服务器的配置参数,并获取多个备用服务器的配置参数及操作状态;
基于所述多个备用服务器的操作状态,在多个备用服务器中确定用于替换所述特定服务器的候选替换服务器;
基于所述特定服务器的配置参数与所述候选替换服务器的配置参数,在所述候选替换服务器中确定匹配所述特定服务器的替换服务器;
输出用于将所述特定服务器中存储的用于执行任务的数据转移到所述替换服务器中的整机替换消息;
在所述特定服务器被所述替换服务器替换的情况下,更新所述服务器群组中的服务器配置参数。
2.如权利要求1所述的硬件故障修复方法,其中,所述操作状态包括硬件状态和网络连接状态;
基于所述多个备用服务器的操作状态,在多个备用服务器中确定用于替换所述特定服务器的候选替换服务器包括:
在所述多个备用服务器中选择一备用服务器,
在所述硬件状态指示该备用服务器的硬件状态正常,并且所述网络连接状态指示该备用服务器的网络连接状态正常的情况下,将该备用服务器确定为候选替换服务器。
3.如权利要求1所述的硬件故障修复方法,其中,所述备用服务器是与所述服务器群组联网的空闲服务器。
4.如权利要求1-3任一项所述的硬件故障修复方法,其中,基于售卖权重、服务器群组中服务器的可用性以及服务器的机型余量确定所述多个备用服务器的数量,其中售卖权重是根据服务器的市场投放计划确定的权重参数,可用性是指示服务器群组中服务器故障率的参数,机型余量是指示服务器群组中与特定服务器相同机型的服务器的数量的参数。
5.如权利要求1所述的硬件故障修复方法,其中,配置参数包括以下各项中的至少一项:机房单元信息、产品型号信息、设备类型信息、硬件版本信息、尺寸信息。
6.如权利要求1所述的硬件故障修复方法,其中,在所述特定服务器被所述替换服务器替换之前,所述硬件故障修复方法还包括:
对所述替换服务器执行硬件状态检查和网络连接状态检查,以确定所述替换服务器的硬件状态和网络连接状态是否正常。
7.如权利要求6所述的硬件故障修复方法,其中,
在所述替换服务器的硬件状态和网络连接状态均正常的情况下,利用所述替换服务器替换所述特定服务器,并进行数据转移;
在所述替换服务器的硬件状态或网络连接状态不正常的情况下,从所述多个备用服务器中重新选择替换服务器。
8....
【专利技术属性】
技术研发人员:李斯达,赵亮,刘晨科,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。