一种故障修复方法及监控节点技术

技术编号:15959412 阅读:42 留言:0更新日期:2017-08-08 09:57
本发明专利技术提供一种故障修复方法及监控节点,在获取故障节点的运行环境信息后,基于故障节点的运行环境信息,模拟故障节点的运行环境,在模拟的运行环境中重现故障节点的故障,以得到故障对应的故障修复方案,这样在服务器集群出现故障时,可以在其他设备如远端节点上模拟服务器集群中的故障,得到故障对应的故障修复方案,进而当故障发生时,对服务器集群不必实施复杂的在线调试操作,降低对服务器集群的性能和数据完整性的影响。且由于是模拟故障节点的运行环境,在模拟的运行环境中可通过人工干预和在线调试等方式来快速定位故障,并在得到故障修复方案后可快速推送到故障节点,达到快速修复的目的。

【技术实现步骤摘要】
一种故障修复方法及监控节点
本专利技术属于设备故障处理
,更具体的说,尤其涉及一种故障修复方法及监控节点。
技术介绍
随着云时代的来临,大数据也吸引了越来越多的关注,所谓大数据是大量非结构化数据和半结构化数据的集合,这些数据在下载到数据库用于分析时会花费大量时间,因此为了有效处理大数据,需要为大数据构件专有的服务器集群。其中服务器集群将多个服务器集中在一起处理同一种服务,这样服务器集群就可以利用多个服务器进行服务的并行处理以获得高效的处理能力,但是在基于服务器集群处理大数据时,会出现服务器集群中组件故障情况,比如:组件依赖的文件损坏;与组件关联的组件配置变更;资源更新配置不合理以及组件版本升级错误等,而在这种情况下,若对服务器集群进行在线调试诊断,会影响服务器集群的处理性能,甚至会对数据造成影响。为此需要一种故障修复方法及设备,在模拟环境中得到故障修复方案,再触发真实环境中的故障节点基于故障修复方案进行故障修复。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种故障修复方法及监控节点,用于在模拟的运行环境中重现故障节点的故障,以在模拟的运行环境中得到故障修复方案。具体的,技术方本文档来自技高网...

【技术保护点】
一种故障修复方法,其特征在于,所述方法包括:获取故障节点的运行环境信息;基于所述故障节点的运行环境信息,模拟所述故障节点的运行环境;在模拟的运行环境中重现所述故障节点的故障,以得到所述故障对应的故障修复方案。

【技术特征摘要】
1.一种故障修复方法,其特征在于,所述方法包括:获取故障节点的运行环境信息;基于所述故障节点的运行环境信息,模拟所述故障节点的运行环境;在模拟的运行环境中重现所述故障节点的故障,以得到所述故障对应的故障修复方案。2.根据权利要求1所述的方法,其特征在于,所述获取故障节点的运行环境信息包括:向所述故障节点发送镜像指令;获取所述故障节点根据所述镜像指令采集到的镜像文件,所述镜像文件包含所述故障节点的运行环境信息。3.根据权利要求2所述的方法,其特征在于,所述获取故障节点的运行环境信息,还包括:在向所述故障节点发送镜像指令之前,为节点所处集群环境构建基础镜像文件;通过所述基础镜像文件在节点中创建第一容器,并通过所述第一容器配置所述集群环境依赖的参数,得到所述集群环境的专属镜像文件;所述镜像指令包括:容器运行指令、运行环境记录指令和镜像返回指令,所述容器运行指令用于控制所述故障节点运行所述第一容器;所述运行环境记录指令用于控制所述故障节点通过所述第一容器记录所述故障节点的运行环境信息;所述镜像返回指令用于控制所述故障节点通过所述故障节点的运行环境信息更新所述集群环境的专属镜像文件中故障节点对应的专属镜像文件,得到更新后的镜像文件并将更新后的镜像文件返回。4.根据权利要求2所述的方法,其特征在于,所述在模拟的运行环境中重现所述故障节点的故障,以得到所述故障对应的故障修复方案包括:在模拟的运行环境中依据所述镜像文件创建第二容器,并在所述模拟的运行环境中运行所述第二容器,从而重现所述故障节点的故障;对所述故障节点的故障进行分析,得到所述故障对应的故障修复方案。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:通过节点中的采集单元获取所述节点的运行状态信息;当所述节点的运行状态信息满足预设条件时,确定所述节点为故障节点。6.一种监控节点,其特征...

【专利技术属性】
技术研发人员:尹正军
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1