一种虚拟机故障修复的方法和设备技术

技术编号:25755917 阅读:28 留言:0更新日期:2020-09-25 21:05
本发明专利技术提供了一种虚拟机故障修复的方法和设备,该方法包括以下步骤:响应于监控到虚拟机故障的告警信息,将告警信息在告警数据库中进行模糊检索;将告警信息与模糊检索得到的多种修复方案进行精准匹配,并使用精准匹配得到的修复方案修复虚拟机;响应于虚拟机修复成功,将精准匹配得到的修复方案进行标记;为带有标记的修复方案建立缓存。通过使用本发明专利技术的方案,能够提高虚拟资源的使用率和使用寿命,降低人工运维成本和设备成本,提高生产率。

【技术实现步骤摘要】
一种虚拟机故障修复的方法和设备
本领域涉及计算机领域,并且更具体地涉及一种虚拟机故障修复的方法和设备。
技术介绍
当前的运维现状,大多还停留在人工维护或者软件进行管理但依旧由人工进行排查具体故障并修复的阶段。由于资源数量众多,人工维护的效率有限,导致资源的使用寿命和使用效率下降,造成资源使用成本上升。因此如何提高资源的维护效率、提高资源的使用率和使用寿命就是一个需要面临解决的问题。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提出一种虚拟机故障修复的方法和设备,通过使用本专利技术的方法,能够提高虚拟资源的使用率和使用寿命,降低人工运维成本和设备成本,提高生产率。基于上述目的,本专利技术的实施例的一个方面提供了一种虚拟机故障修复的方法,包括以下步骤:响应于监控到虚拟机故障的告警信息,将告警信息在告警数据库中进行模糊检索;将告警信息与模糊检索得到的多种修复方案进行精准匹配,并使用精准匹配得到的修复方案修复虚拟机;响应于虚拟机修复成功,将精准匹配得到的修复方案进行标记;为带有标记的修复方案建立缓存。根据本专利技术的一个实施例,将所述告警信息与所述模糊检索得到的多种修复方案进行精准匹配还包括:将模糊检索得到的不同方案利用机器学习算法对不同方案进行训练以得到唯一的修复方案。根据本专利技术的一个实施例,还包括:响应于监控到虚拟机故障的告警信息,将告警信息发送给运维人员。根据本专利技术的一个实施例,还包括:响应于精准匹配得到的修复方案不能修复虚拟机,将修复方案发送到运维人员并进行标记;在修复虚拟机后将对应的修复方案上传到告警数据库中,并将对应的修复方案与告警信息进行关联。根据本专利技术的一个实施例,基于告警信息的关键字进行模糊检索,精准匹配为关联规则推荐算法匹配。本专利技术的实施例的另一个方面,还提供了一种虚拟机故障修复的设备,设备包括:检索模块,检索模块配置为响应于监控到虚拟机故障的告警信息,将告警信息在告警数据库中进行模糊检索;匹配模块,匹配模块配置为将告警信息与模糊检索得到的多种修复方案进行精准匹配,并使用精准匹配得到的修复方案修复虚拟机;标记模块,标记模块配置为响应于虚拟机修复成功,将精准匹配得到的修复方案进行标记;缓存模块,缓存模块配置为为带有标记的修复方案建立缓存。根据本专利技术的一个实施例,匹配模块进一步配置为将模糊检索得到的不同方案利用机器学习算法对不同方案进行训练以得到唯一的修复方案。根据本专利技术的一个实施例,还包括传输模块,传输模块配置为响应于监控到虚拟机故障的告警信息,将告警信息发送给运维人员。根据本专利技术的一个实施例,还包括关联模块,关联模块配置为:响应于精准匹配得到的修复方案不能修复虚拟机,将修复方案发送到运维人员并进行标记;运维人员修复虚拟机后将对应的修复方案上传到告警数据库中,并将对应的修复方案与告警信息进行关联。根据本专利技术的一个实施例,基于告警信息的关键字进行模糊检索,精准匹配为关联规则推荐算法匹配。本专利技术具有以下有益技术效果:本专利技术实施例提供的虚拟机故障修复的方法,通过响应于监控到虚拟机故障的告警信息,将告警信息在告警数据库中进行模糊检索;将告警信息与模糊检索得到的多种修复方案进行精准匹配,并使用精准匹配得到的修复方案修复虚拟机;响应于虚拟机修复成功,将精准匹配得到的修复方案进行标记;为带有标记的修复方案建立缓存的技术方案,能够提高虚拟资源的使用率和使用寿命,降低人工运维成本和设备成本,提高生产率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。图1为根据本专利技术一个实施例的虚拟机故障修复的方法的示意性流程图;图2为根据本专利技术一个实施例的虚拟机故障修复的设备的示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术实施例进一步详细说明。基于上述目的,本专利技术的实施例的第一个方面,提出了一种虚拟机故障修复的方法的一个实施例。图1示出的是该方法的示意性流程图。如图1中所示,该方法可以包括以下步骤:S1响应于监控到虚拟机故障的告警信息,将告警信息在告警数据库中进行模糊检索,运维人员可以通过执行脚本定时任务进行自动监控资源,主要检测虚拟机状态和运行在虚拟机上服务的状态,故障自动修复方案的关键在于告警入库后并不是直接将告警进行上报,而是利用数据库的形式建立告警修复方案库,该数据库采用SQLServer2005对海量数据进行存储;S2将告警信息与模糊检索得到的多种修复方案进行精准匹配,并使用精准匹配得到的修复方案修复虚拟机,告警数据库的数据量越来越大后会遇到检索效率低的问题,而检索效率问题直接关系到告警上报是否及时、告警修复效率的问题,因此提高检索效率需要通过建立广泛的索引来提高,利用模糊查询对方案进行检索,再通过精准匹配的方法最终确定一条执行方案;S3响应于虚拟机修复成功,将精准匹配得到的修复方案进行标记;S4为带有标记的修复方案建立缓存,可以更好的提高检索效率。本专利技术包括资源监控、资源修复和信息反馈。运维人员可以通过管理平台统一对资源进行查看、操作。对于虚拟资源在运行过程中产生的故障、告警等问题,运维人员可通过管理平台第一时间知晓。对于部分故障原因,管理平台在上报给运维人员信息的同时触发自动修复功能对资源进行主动修复。通过本专利技术的技术方案,能够提高虚拟资源的使用率和使用寿命,降低人工运维成本和设备成本,提高生产率。在本专利技术的一个优选实施例中,将告警信息与模糊检索得到的多种修复方案进行精准匹配还包括:将模糊检索得到的不同方案利用机器学习算法对不同方案进行训练以得到唯一的修复方案。通过建立告警数据库的方式,对运维的操作不断进行积累,对执行后服务恢复正常的方案进行标记,同时对执行后服务无法恢复正常的方案进行标记并降低其优先级,避免下次在相同问题出现时执行到不可行的方案。对于查询到的不同方案,利用机器学习算法对其进行训练,这个训练过程需要在脱离正式业务的环境中进行。即在测试的环境中进行训练最终达到的效果是:告警修复方案库中的每一条方案都唯一对应一个问题且是该问题的最佳修复方案。达到该效果后将告警修复方案库导入正常运维的业务中,实现自动化运维。在本专利技术的一个优选实施例中,还包括:响应于监控到虚拟机故障的告警信息,将告警信息发送给运维人员。运维人员需要第一时间了解告警情况,并对后续的修复情况进行监控。在本专利技术的一个优选实施例中,还包括:响应于精准匹配得到的修复方案不能修复虚拟机,将修复方案发送到运维人员并进行标记;在修本文档来自技高网...

【技术保护点】
1.一种虚拟机故障修复的方法,其特征在于,包括以下步骤:/n响应于监控到所述虚拟机故障的告警信息,将所述告警信息在告警数据库中进行模糊检索;/n将所述告警信息与所述模糊检索得到的多种修复方案进行精准匹配,并使用所述精准匹配得到的修复方案修复所述虚拟机;/n响应于所述虚拟机修复成功,将所述精准匹配得到的修复方案进行标记;/n为带有所述标记的修复方案建立缓存。/n

【技术特征摘要】
1.一种虚拟机故障修复的方法,其特征在于,包括以下步骤:
响应于监控到所述虚拟机故障的告警信息,将所述告警信息在告警数据库中进行模糊检索;
将所述告警信息与所述模糊检索得到的多种修复方案进行精准匹配,并使用所述精准匹配得到的修复方案修复所述虚拟机;
响应于所述虚拟机修复成功,将所述精准匹配得到的修复方案进行标记;
为带有所述标记的修复方案建立缓存。


2.根据权利要求1所述的方法,其特征在于,将所述告警信息与所述模糊检索得到的多种修复方案进行精准匹配还包括:
将所述模糊检索得到的不同方案利用机器学习算法对所述不同方案进行训练以得到唯一的修复方案。


3.根据权利要求1所述的方法,其特征在于,还包括:
响应于监控到所述虚拟机故障的告警信息,将所述告警信息发送给运维人员。


4.根据权利要求1所述的方法,其特征在于,还包括:
响应于所述精准匹配得到的修复方案不能修复所述虚拟机,将所述修复方案发送到所述运维人员并进行标记;
在修复所述虚拟机后将对应的修复方案上传到所述告警数据库中,并将所述对应的修复方案与告警信息进行关联。


5.根据权利要求1所述的方法,其特征在于,基于所述告警信息的关键字进行模糊检索,所述精准匹配为关联规则推荐算法匹配。


6.一种虚拟机故障修复的设备,其特征在于,...

【专利技术属性】
技术研发人员:张源升何万县王晓通
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1