【技术实现步骤摘要】
提高集群系统可用性的方法、装置和计算机设备
本申请涉及分布式部署
,特别涉及一种提高集群系统可用性的方法、装置和计算机设备。
技术介绍
随着计算机技术和互联网的快速发展,集群系统以其低廉的成本、强大的运算能力和健壮的容错机制逐渐成为了计算机行业的焦点。集群应用可以运行在上千台普通的服务器上,伴随业务增长动态扩大集群规模,但也要承受普通计算机较高的故障率,这要求系统在发生软硬件故障的时候仍能保证高度的可用性。目前,在系统发生故障时,仅能在本地的主机上进行系统服务的转移,而没有考虑到其它服务区域的主机,从而使得基于Docker容器的集群系统的可用性不高,无法应对大规模的系统故障。
技术实现思路
本申请的主要目的为提供一种提高集群系统可用性的方法、装置和计算机设备,旨在解决现有基于Docker容器的集群系统的可用性低,无法应对大规模的系统故障的弊端。为实现上述目的,本申请提供了一种提高集群系统可用性的方法,应用于所述集群系统中的任意一台主机,所述集群系统包括多个服务区域,所述服务区域分布于不同地区,当前执行所述方法的主机为第一主机,所述方法包括:监控各第二主机当前是否出现故障,其中,所述第二主机为所述第一主机之外的其它主机;若出现故障,则标记当前处于故障状态的第二主机为故障主机,并从各指定服务区域中筛选当前处于可调用状态的主机作为备用主机,其中,所述指定服务区域为所述故障主机所属的服务区域之外的其它服务区域,所述可调用状态的主机为服务调用占比和运行负载符合第一预设要求的主机;使用所述备用主机运行所述故障主机的系统服务。进一步的,所述监控各第二主机当前是否出现故 ...
【技术保护点】
1.一种提高集群系统可用性的方法,其特征在于,应用于所述集群系统中的任意一台主机,所述集群系统包括多个服务区域,所述服务区域分布于不同地区,当前执行所述方法的主机为第一主机,所述方法包括:监控各第二主机当前是否出现故障,其中,所述第二主机为所述第一主机之外的其它主机;若出现故障,则标记当前处于故障状态的第二主机为故障主机,并从各指定服务区域中筛选当前处于可调用状态的主机作为备用主机,其中,所述指定服务区域为所述故障主机所属的服务区域之外的其它服务区域,所述可调用状态的主机为服务调用占比和运行负载符合第一预设要求的主机;使用所述备用主机运行所述故障主机的系统服务。
【技术特征摘要】
1.一种提高集群系统可用性的方法,其特征在于,应用于所述集群系统中的任意一台主机,所述集群系统包括多个服务区域,所述服务区域分布于不同地区,当前执行所述方法的主机为第一主机,所述方法包括:监控各第二主机当前是否出现故障,其中,所述第二主机为所述第一主机之外的其它主机;若出现故障,则标记当前处于故障状态的第二主机为故障主机,并从各指定服务区域中筛选当前处于可调用状态的主机作为备用主机,其中,所述指定服务区域为所述故障主机所属的服务区域之外的其它服务区域,所述可调用状态的主机为服务调用占比和运行负载符合第一预设要求的主机;使用所述备用主机运行所述故障主机的系统服务。2.根据权利要求1所述的提高集群系统可用性的方法,其特征在于,所述监控各第二主机当前是否出现故障的步骤,包括:根据第一预设频率接收各所述第二主机发送的预设信号,以实现对各所述第二主机的工作状态的监控;若接收到所述第二主机发送的预设信号,则判定所述第二主机当前运行正常;若没有接收到所述第二主机发送的预设信号,则将没有发送所述预设信号的主机标记为指定主机,并在当前时间之后的预设时间段内,判断是否接收到所述指定主机发送的所述预设信号;若接收到所述指定主机发送的所述预设信号,则判定所述指定主机运行正常;若没有接收到所述指定主机发送的所述预设信号,则判定所述指定主机出现故障。3.根据权利要求1所述的提高集群系统可用性的方法,其特征在于,所述从各指定服务区域中筛选当前处于可调用状态的主机作为备用主机的步骤,包括:获取各所述指定服务区域当前的分级信息,所述分级信息为根据各服务区域的服务调用占比对应设置的等级信息;根据所述分级信息筛选当前处于可调用状态的服务区域,其中,所述可调用状态的服务区域为所述分级信息符合第二预设要求的服务区域;获取所述当前处于可调用状态的服务区域中各主机的运行信息,所述运行信息包括主机的服务调用占比和运行负载;从所述当前处于可调用状态的服务区域中,筛选所述运行信息符合第三预设要求的主机作为所述备用主机。4.根据权利要求3所述的提高集群系统可用性的方法,其特征在于,所述获取各所述指定服务区域当前的分级信息的步骤之前,包括:根据第二预设频率,获取所述第二预设频率对应的时间段内的第一服务调用次数以及各所述第二主机分别对应的第二服务调用次数,其中,所述第一服务调用次数为所述第一主机的系统服务的调用次数,所述第二服务调用次数为所述第二主机的系统服务的调用次数;根据所述第一服务调用次数和各所述第二服务调用次数,分别计算得到服务调用总次数,以及各所述服务区域的服务调用子次数;根据各所述服务调用子次数和所述服务调用总次数,分别计算得到各所述服务区域对应的服务调用占比;将各所述服务调用占比输入预先构建的分级信息库中,分别匹配得到各服务调用占比对应的分级信息,其中,所述分级信息库包括服务调用占比与分级信息映射关系表;...
【专利技术属性】
技术研发人员:赵骏,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。