一种计算节点单点高可用控制方法及装置制造方法及图纸

技术编号:24333819 阅读:31 留言:0更新日期:2020-05-29 21:10
本发明专利技术涉及了一种计算节点单点高可用控制方法及装置,其中该方法包括:配置高可用监视器和高可用引擎;利用高可用监视器监控云主机进程状态、节点进程状态和计算节点运行状态;基于所述云主机进程状态、节点进程状态、计算节点运行状态将相应的故障信息发送至高可用消息队列;通过高可用引擎读取高可用消息队列的故障信息以执行相应的故障处理。本发明专利技术的实施例避免了现有的高可用方案中只要出现异常就将异常计算节点上所有云主机进行重建的情况,极大地降低了资源的浪费,更进一步提高了云平台系统的高可用性。

A single point high availability control method and device for computing nodes

【技术实现步骤摘要】
一种计算节点单点高可用控制方法及装置
本专利技术涉及云计算
本专利技术进一步涉及一种计算节点单点高可用控制方法及装置。
技术介绍
目前,云计算管理平台发展迅速,对于分布式系统架构的云平台系统,保障系统的高可用是系统开发、构建的核心。对于现有的一些云平台系统OpenStack包含两个主要模块:Nova和Swift,前者是NASA(美国国家航空和宇宙航行局,NationalAeronauticsandSpaceAdministration)开发的虚拟服务器部署和业务计算模块;后者是Rackspace(一家全球领先的托管服务器及云计算提供商)开发的分布式云存储模块,两者可以一起用,也可以分开单独用。Nova是最核心的,一套虚拟化管理程序,可管理网络和存储。Nova中包含了许多的小组件,其中nova-compute(nova计算)用于处理管理实例生命周期。通过消息队列接收请求,并承担操作工作。针对云平台系统的高可用方法,常采用Nova模块提供的高可用方法。进一步地,通过nova-compute服务来确定计算节点的服务是否可靠。当发现不可靠时,会使用Evacuate(疏散)命令将不可靠的计算节点上所有云主机进行重建,但是这样的措施在很多情况下并不合理,很可能造成极大的资源浪费。因此,对云主机系统的高可用方法仍需要进行改进,尽可能避免所有云主机的重建,更进一步提高云平台系统的高可用性。
技术实现思路
一方面,本专利技术基于上述目的提出了一种计算节点单点高可用控制方法,其中该方法包括以下步骤:<br>配置高可用监视器和高可用引擎;利用高可用监视器监控云主机进程状态、节点进程状态和计算节点运行状态;基于所述云主机进程状态、节点进程状态、计算节点运行状态将相应的故障信息发送至高可用消息队列;通过高可用引擎读取高可用消息队列的故障信息以执行相应的故障处理。根据本专利技术的计算节点单点高可用控制方法的实施例,其中基于云主机进程状态、节点进程状态、计算节点运行状态将相应的故障信息发送至高可用消息队列进一步包括:响应于云主机进程状态异常且节点进程状态以及计算节点运行状态正常,将云主机故障的信息发送至高可用消息队列。根据本专利技术的计算节点单点高可用控制方法的实施例,其中基于云主机进程状态、节点进程状态、计算节点运行状态将相应的故障信息发送至高可用消息队列进一步包括:响应于节点进程状态异常、计算节点运行状态正常并且云主机进程状态正常或异常,重启异常的节点进程;响应于重启多次无法消除异常,将节点进程故障的信息发送至高可用消息队列。根据本专利技术的计算节点单点高可用控制方法的实施例,其中基于云主机进程状态、节点进程状态、计算节点运行状态将相应的故障信息发送至高可用消息队列进一步包括:响应于计算节点运行状态异常且节点进程状态以及云主机进程状态正常,将计算节点故障的信息发送至高可用消息队列。根据本专利技术的计算节点单点高可用控制方法的实施例,其中通过高可用引擎读取高可用消息队列的故障信息执行相应的故障处理进一步包括:基于高可用消息队列的云主机故障的信息通过高可用引擎调用管理组件重启相应的云主机。根据本专利技术的计算节点单点高可用控制方法的实施例,其中通过高可用引擎读取高可用消息队列的故障信息执行相应的故障处理进一步包括:基于高可用消息队列的节点进程故障的信息通过高可用引擎调用管理组件强制结束相应的进程。根据本专利技术的计算节点单点高可用控制方法的实施例,其中通过高可用引擎读取高可用消息队列的故障信息执行相应的故障处理进一步包括:基于高可用消息队列的计算节点故障的信息通过高可用引擎调用管理组件迁移相应计算节点上的所有云主机并强制关闭计算节点。根据本专利技术的计算节点单点高可用控制方法的实施例,其中通过高可用引擎读取高可用消息队列的故障信息执行相应的故障处理进一步包括:对迁移的云主机做标记;排除关闭的计算节点的故障并重启;将标记的云主机迁移回重启的计算节点。根据本专利技术的计算节点单点高可用控制方法的实施例,其中基于云主机进程状态、节点进程状态、计算节点运行状态将相应的故障信息发送至高可用消息队列进一步包括:在高可用消息队列中对接收的故障信息按照故障信息的权重排序,故障信息的权重至少基于故障信息类型权重和故障时间权重确定。另一方面,本专利技术还提出了一种计算节点单点高可用控制装置,其中该装置包括:高可用配置模块,该高可用配置模块配置为配置高可用监视器和高可用引擎;状态监控模块,该状态监控模块配置为利用高可用监视器监控云主机进程状态、节点进程状态和计算节点运行状态;故障信息生成模块,该故障信息生成模块配置为基于云主机进程状态、节点进程状态、计算节点运行状态将相应的故障信息发送至高可用消息队列;和故障处理模块,该故障处理模块配置为通过高可用引擎读取高可用消息队列的故障信息以执行相应的故障处理。采用上述技术方案,本专利技术至少具有如下有益效果:通过对单计算节点上的云主机、节点进程和计算节点运行的监控进一步细化故障类型,将故障信息以消息队列的形式排列起来,逐一进行相应的处理,避免了只要出现异常就将异常计算节点上所有云主机进行重建的情况,极大地降低了资源的浪费,更进一步提高了云平台系统的高可用性。本专利技术提供了实施例的各方面,不应当用于限制本专利技术的保护范围。根据在此描述的技术可设想到其它实施方式,这对于本领域普通技术人员来说在研究以下附图和具体实施方式后将是显而易见的,并且这些实施方式意图被包含在本申请的范围内。下面参考附图更详细地解释和描述了本专利技术的实施例,但它们不应理解为对于本专利技术的限制。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对现有技术和实施例描述中所需要使用的附图作简单地介绍,附图中的部件不一定按比例绘制,并且可以省略相关的元件,或者在一些情况下比例可能已经被放大,以便强调和清楚地示出本文描述的新颖特征。另外,如本领域中已知的,结构顺序可以被不同地布置。图1示出了根据本专利技术的计算节点单点高可用控制方法的实施例的示意性框图;图2示出了根据本专利技术的计算节点单点高可用控制装置的示意性框图。具体实施方式虽然本专利技术可以以各种形式实施,但是在附图中示出并且在下文中将描述一些示例性和非限制性实施例,但应该理解的是,本公开将被认为是本专利技术的示例并不意图将本专利技术限制于所说明的具体实施例。在下文就本专利技术的实施例的说明中需要注意的是,其中提到的步骤的编号在没有特殊说明的情况下,仅用于便捷明确地指示该步骤,并不限定所述步骤的顺序。图1示出了根据本专利技术的计算节点单点高可用控制方法的实施例的示意性框图。在如图1所示的实施例中,该方法至少包括以下步骤:S1:配置高可用监视器和高可用引擎;S2:利用高可用监视器监控云主机进程状态、节点进程状态和计算节点运行状态;S3:基于云主机进程状态、节点进程状态、计算节点运行状态将相应的故障信息发本文档来自技高网...

【技术保护点】
1.一种计算节点单点高可用控制方法,其特征在于,所述方法包括以下步骤:/n配置高可用监视器和高可用引擎;/n利用所述高可用监视器监控云主机进程状态、节点进程状态和计算节点运行状态;/n基于所述云主机进程状态、所述节点进程状态、所述计算节点运行状态将相应的故障信息发送至高可用消息队列;/n通过所述高可用引擎读取所述高可用消息队列的故障信息以执行相应的故障处理。/n

【技术特征摘要】
1.一种计算节点单点高可用控制方法,其特征在于,所述方法包括以下步骤:
配置高可用监视器和高可用引擎;
利用所述高可用监视器监控云主机进程状态、节点进程状态和计算节点运行状态;
基于所述云主机进程状态、所述节点进程状态、所述计算节点运行状态将相应的故障信息发送至高可用消息队列;
通过所述高可用引擎读取所述高可用消息队列的故障信息以执行相应的故障处理。


2.根据权利要求1所述的方法,其特征在于,所述基于所述云主机进程状态、所述节点进程状态、所述计算节点运行状态将相应的故障信息发送至高可用消息队列进一步包括:
响应于所述云主机进程状态异常且所述节点进程状态以及所述计算节点运行状态正常,将云主机故障的信息发送至所述高可用消息队列。


3.根据权利要求1所述的方法,其特征在于,所述基于所述云主机进程状态、所述节点进程状态、所述计算节点运行状态将相应的故障信息发送至高可用消息队列进一步包括:
响应于所述节点进程状态异常、所述计算节点运行状态正常并且所述云主机进程状态正常或异常,重启所述异常的节点进程;
响应于重启多次无法消除异常,将节点进程故障的信息发送至所述高可用消息队列。


4.根据权利要求1所述的方法,其特征在于,所述基于所述云主机进程状态、所述节点进程状态、所述计算节点运行状态将相应的故障信息发送至高可用消息队列进一步包括:
响应于所述计算节点运行状态异常且所述节点进程状态以及所述云主机进程状态正常,将计算节点故障的信息发送至所述高可用消息队列。


5.根据权利要求2所述的方法,其特征在于,所述通过高可用引擎读取所述高可用消息队列的故障信息执行相应的故障处理进一步包括:
基于所述高可用消息队列的云主机故障的信息通过所述高可用引擎调用管理组件重启相应的云主机。


6...

【专利技术属性】
技术研发人员:李亚端
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1