一种基于云环境的故障处理方法及系统技术方案

技术编号:15749739 阅读:331 留言:0更新日期:2017-07-03 14:45
本发明专利技术公开了一种基于云环境的故障处理方法,包括:根据目标探测策略对被测节点进行探测,得到目标探测结果;根据目标备份策略对被测节点进行备份,得到目标备份结果;若根据目标探测结果判定被测节点为故障节点,则确定与被测节点相对应的目标恢复策略,根据目标恢复策略及目标备份结果对被测节点进行恢复。可见,在本方案中,运维人员可在一个界面上进行全部业务的故障管理和配置,例如针对不同业务分别制定不同的处理策略,该处理策略包括探测策略、备份策略,以及恢复策略,通过该处理策略,可及时对被测节点进行故障检测及恢复,有效减轻运维人员的工作量;本发明专利技术还公开了一种基于云环境的故障处理系统,同样能实现上述技术效果。

【技术实现步骤摘要】
一种基于云环境的故障处理方法及系统
本专利技术涉及云计算领域,更具体地说,涉及一种基于云环境的故障处理方法及系统。
技术介绍
目前的云数据中心的运维工作,有很大一部分在于处理业务线上运行过程中出现的种种故障异常,而在恢复过程中,往往处理的流程都是统一的,即先将故障节点下线,再将故障节点上的应用重启或重装或还原节点至上个版本,最后将恢复的节点再加入线上集群之中。这一过程需要多种工具结合使用,并且不同的业务,故障类型也不同,处理方式也不太相同,这会带来相当多的工作量。在目前的云数据中心当中,客户实际运行业务的相当一部分资源是虚拟资源,那么如何利用虚拟化已有的功能点,更方便的实现虚拟机的备份、还原、重部署、网络分配、软件重装等功能,是本领域技术人员需要解决的问题。
技术实现思路
本专利技术的目的在于提供一种基于云环境的故障处理方法及系统,以实现对故障节点的处理,减轻运维人员的工作量。为实现上述目的,本专利技术实施例提供了如下技术方案:一种基于云环境的故障处理方法,包括:确定与被测节点相对应的目标探测策略,根据所述目标探测策略对所述被测节点进行探测,得到目标探测结果;确定与所述被测节点相对应的目标备份策略,根据所述目标备份策略对所述被测节点进行备份,得到目标备份结果;若根据所述目标探测结果判定所述被测节点为故障节点,则确定与所述被测节点相对应的目标恢复策略,根据所述目标恢复策略及所述目标备份结果对所述被测节点进行恢复。其中,根据所述目标探测策略对所述被测节点进行探测,包括:利用所述目标探测策略,定时对所述被测节点的不同类型的资源采用不同的探测方式进行探测。其中,所述定时对所述被测节点的不同类型的资源采用不同的探测方式进行探测,包括:定时对所述被测节点的不同类型的资源,采用不同的探测方式获取所述被测节点的网页类状态信息及ftp类状态信息。其中,所述根据所述目标备份策略对所述被测节点进行备份,包括:根据所述目标备份策略,定时调用虚拟化接口对所述被测节点通过虚拟机快照方式,或者虚拟机镜像方式进行备份。一种基于云环境的故障处理系统,包括任务调度模块和处理模块;所述任务调度模块,用于确定与被测节点相对应的目标探测策略、目标备份策略及目标恢复策略,并调用对应的处理模块执行对应的处理操作;所述处理模块包括:故障探测模块,用于根据所述目标探测策略对所述被测节点进行探测,得到目标探测结果;节点备份模块,用于根据所述目标备份策略对所述被测节点进行备份,得到目标备份结果;故障处理模块,用于根据所述目标探测结果判定所述被测节点为故障节点时,根据所述目标恢复策略及所述目标备份结果对所述被测节点进行恢复。其中,所述任务调度模块具体为springquartz集群。其中,所述故障探测模块利用所述目标探测策略,定时对所述被测节点的不同类型的资源采用不同的探测方式进行探测。其中,所述故障探测模块定时对所述被测节点的不同类型的资源,采用不同的探测方式获取所述被测节点的网页类状态信息及ftp类状态信息。其中,所述故障探测模块与所述被测节点部署在同一局域网内。其中,所述节点备份模块根据所述目标备份策略,定时调用虚拟化接口对所述被测节点通过虚拟机快照方式,或者虚拟机镜像方式进行备份。通过以上方案可知,本专利技术实施例提供的一种基于云环境的故障处理方法,包括:确定与被测节点相对应的目标探测策略,根据所述目标探测策略对所述被测节点进行探测,得到目标探测结果;确定与所述被测节点相对应的目标备份策略,根据所述目标备份策略对所述被测节点进行备份,得到目标备份结果;若根据所述目标探测结果判定所述被测节点为故障节点,则确定与所述被测节点相对应的目标恢复策略,根据所述目标恢复策略及所述目标备份结果对所述被测节点进行恢复。可见,在本方案中,运维人员可在一个界面上进行全部业务的故障管理和配置,例如针对不同业务分别制定不同的处理策略,该处理策略包括探测策略、备份策略,以及恢复策略,通过该处理策略,可及时对被测节点进行故障检测及恢复,有效减轻运维人员的工作量;本专利技术还公开了一种基于云环境的故障处理系统,同样能实现上述技术效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例公开的一种基于云环境的故障处理方法流程示意图;图2为本专利技术实施例公开的故障处理整体架构图;图3为本专利技术实施例公开的具体的故障处理方法流程示意图;图4为本专利技术实施例公开的一种基于云环境的故障处理系统结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术实施例公开了一种基于云环境的故障处理方法及系统,以实现对故障节点的处理,减轻运维人员的工作量。参见图1,本专利技术实施例提供的一种基于云环境的故障处理方法,包括:S101、确定与被测节点相对应的目标探测策略,根据所述目标探测策略对所述被测节点进行探测,得到目标探测结果;其中,根据所述目标探测策略对所述被测节点进行探测,包括:利用所述目标探测策略,定时对所述被测节点的不同类型的资源采用不同的探测方式进行探测。具体的,所述定时对所述被测节点的不同类型的资源采用不同的探测方式进行探测,包括:定时对所述被测节点的不同类型的资源,采用不同的探测方式获取所述被测节点的网页类状态信息及ftp类状态信息。具体的,本方案通过故障探测模块对被测节点进行故障探测,可以理解的是,本方案对被测节点的探测对象具体为被测节点的各种状态信息,例如网页类状态信息及ftp类状态信息等;通过对状态信息的分析,可以判断被测节点是否为故障节点;若为故障节点,则通过S103对故障节点进行恢复。需要说明的是,本实施例中的故障探测模块对被测节点进行探测时,需要直接与被测节点进行对接,因此部署该模块时,需要能访问到各个业务节点,并且开通对应协议的访问权限;在部署时,首先需要满足故障探测模块与被监控的业务节点保持网络连通,可以一起部署,也可以异地部署;但是。由于进行各类监测时会产生网络流量,为保证传输速度不成为瓶颈,在本实施例中优选将故障探测模块与被测节点部署在同一局域网内。具体的,参见图2,为本实施例提供的故障处理整体架构图,参见图3,为本实施例提供的具体的故障处理方法流程示意图,可以看出,用户想要添加新的被测节点时,需要填写故障隔离策略信息,该故障隔离策略信息中包括处理策略,该处理策略具体包括探测策略、备份策略,以及恢复策略等,通过该处理策略,可实现对故障节点的探测及恢复。具体的,本方案中的故障探测模块根据探测策略,定时调用探测脚本或代码进行探测,并获取返回结果;通过故障探测模块对被测节点进行探测时,可针对不同类型的资源,调用不同的探测方法,例如通过ping、telent、ftp、http等通用手段,从而增加本模块的业务性及灵活定制性,比如:HAProxy判本文档来自技高网...
一种基于云环境的故障处理方法及系统

【技术保护点】
一种基于云环境的故障处理方法,其特征在于,包括:确定与被测节点相对应的目标探测策略,根据所述目标探测策略对所述被测节点进行探测,得到目标探测结果;确定与所述被测节点相对应的目标备份策略,根据所述目标备份策略对所述被测节点进行备份,得到目标备份结果;若根据所述目标探测结果判定所述被测节点为故障节点,则确定与所述被测节点相对应的目标恢复策略,根据所述目标恢复策略及所述目标备份结果对所述被测节点进行恢复。

【技术特征摘要】
1.一种基于云环境的故障处理方法,其特征在于,包括:确定与被测节点相对应的目标探测策略,根据所述目标探测策略对所述被测节点进行探测,得到目标探测结果;确定与所述被测节点相对应的目标备份策略,根据所述目标备份策略对所述被测节点进行备份,得到目标备份结果;若根据所述目标探测结果判定所述被测节点为故障节点,则确定与所述被测节点相对应的目标恢复策略,根据所述目标恢复策略及所述目标备份结果对所述被测节点进行恢复。2.根据权利要求1所述的故障处理方法,其特征在于,根据所述目标探测策略对所述被测节点进行探测,包括:利用所述目标探测策略,定时对所述被测节点的不同类型的资源采用不同的探测方式进行探测。3.根据权利要求2所述的故障处理方法,其特征在于,所述定时对所述被测节点的不同类型的资源采用不同的探测方式进行探测,包括:定时对所述被测节点的不同类型的资源,采用不同的探测方式获取所述被测节点的网页类状态信息及ftp类状态信息。4.根据权利要求1所述的故障处理方法,其特征在于,所述根据所述目标备份策略对所述被测节点进行备份,包括:根据所述目标备份策略,定时调用虚拟化接口对所述被测节点通过虚拟机快照方式,或者虚拟机镜像方式进行备份。5.一种基于云环境的故障处理系统,其特征在于,包括任务调度模块和处理模块;所述任务调度模...

【专利技术属性】
技术研发人员:杨勇亓开元房体盈
申请(专利权)人:广东浪潮大数据研究有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1