服务节点自隔离方法及系统技术方案

技术编号:32858296 阅读:17 留言:0更新日期:2022-03-30 19:33
本公开提供了一种服务节点自隔离方法,可以应用于云计算技术领域。该方法包括:定时获取服务节点的当前运维数据;根据所述当前运维数据确定故障节点;根据故障节点类型确定故障节点信息;根据所述故障节点信息和预设节点配置信息确定隔离策略;以及根据所述隔离策略对所述服务节点进行隔离。本公开还提供了一种服务节点自隔离系统、设备、存储介质和程序产品。存储介质和程序产品。存储介质和程序产品。

【技术实现步骤摘要】
服务节点自隔离方法及系统


[0001]本公开涉及云计算领域,具体涉及分布式服务节点的自动运维技术,更具体地涉及一种服务节点自隔离方法、系统、设备、介质和程序产品。

技术介绍

[0002]在分布式框架中,当某一节点发生故障时需对该故障节点进行隔离,即不再向该节点分配流量。一般对节点的隔离方式有两种:一种是负载均衡设备定期检查下挂节点并自动移除故障节点;另一种是通过监控报警系统发现故障节点,运维人员手动进行节点下线。
[0003]上述故障节点的隔离方法存在自动化程度低,覆盖场景不全,故障响应时间较长的问题;并且由于无法事前发现有宕机风险的节点,因此无法在节点宕机前进行流量转移,导致用户业务受影响,降低用户使用体验。

技术实现思路

[0004]鉴于上述问题,本公开提供了一种服务节点自隔离方法、装置、设备、介质和程序产品。
[0005]根据本公开的第一个方面,提供了一种服务节点自隔离方法,包括:定时获取服务节点的当前运维数据;
[0006]根据所述当前运维数据确定故障节点;
[0007]根据故障节点类型确定故障节点信息;
[0008]根据所述故障节点信息和预设节点配置信息确定隔离策略;以及
[0009]根据所述隔离策略对所述服务节点进行隔离。
[0010]根据本公开的实施例,所述当前运维数据包括磁盘使用率和数据库节点探活脚本查询值,所述根据所述当前运维数据确定故障节点包括:
[0011]若所述磁盘使用率大于第一阈值且数据库节点探活脚本查询值不为空或报错,则确定故障节点为服务节点;
[0012]若数据库节点探活脚本查询值为空或报错,则确定故障节点为数据库节点和所述数据库节点对应的服务节点。
[0013]根据本公开的实施例,所述当前运维数据还包括JVM堆内存占用量、CPU使用率和内存使用率,所述根据所述当前运维数据确定故障节点还包括:
[0014]根据三西格玛算法、历史运维数据和所述当前运维数据确定故障节点。
[0015]根据本公开的实施例,所述根据三西格玛算法、历史运维数据和所述当前运维数据确定故障节点包括:
[0016]根据历史运维数据和三西格玛算法确定第二阈值和第三阈值;
[0017]若当前运维数据大于第三阈值或小于第二阈值,则确定故障节点为服务节点。
[0018]根据本公开的实施例,所述根据故障节点类型确定故障节点信息包括:
[0019]当确定所述故障节点为服务节点时,获取所述服务节点名称、IP地址和异常指标信息;
[0020]当确定所述故障节点为数据库节点时,获取数据库节点名称。
[0021]根据本公开的实施例,所述预设节点配置信息包括服务节点与web节点的配置信息、软负载均衡与web节点的配置信息和服务节点与数据库节点的配置信息,所述根据所述故障节点信息和预设节点配置信息确定隔离策略包括:
[0022]根据服务节点与web节点的配置信息确定与所述服务节点对应的web节点以及根据软负载均衡与web节点的配置信息确定与web节点的对应的软负载均衡;
[0023]当确定web节点与所述服务节点为一对一关系时,获取软负载均衡下的其他web节点,将所述服务节点流量转发至所述其他web节点;
[0024]当确定web节点与所述服务节点为一对多关系时,获取所述web节点下的其他服务节点,将所述服务节点流量转发至所述其他服务节点。
[0025]根据本公开的实施例,所述将所述服务节点流量转发至所述其他web节点包括:
[0026]若确定所述其他web节点为正常节点,将所述服务节点流量转发至所述其他web节点;
[0027]若确定所述其他web节点为故障节点,将所述服务节点流量转发至其他软负载均衡。
[0028]根据本公开的实施例,所述根据所述故障节点信息和预设节点配置信息确定隔离策略还包括:
[0029]根据所述数据库节点名称和服务节点与数据库节点的配置信息确定与所述数据库节点对应的服务节点;
[0030]将与所述数据库节点对应的服务节点的流量转发至其他服务节点。
[0031]本公开的第二方面提供了一种服务节点重启方法,包括:
[0032]根据第一方面所述的方法确定异常服务节点;
[0033]将所述异常服务节点信息通过K8s组件通知PAAS平台;
[0034]所述PAAS平台对所述异常服务节点进行重启。
[0035]根据本公开实施例,所述PAAS平台对所述异常服务节点进行重启包括:
[0036]PAAS平台向异常服务节点发起停机指令;
[0037]响应于PAAS平台的停机指令,所述异常服务节点通知配置中心解除注册;
[0038]预设时间后,PAAS平台重新拉起新容器;
[0039]新服务节点通知配置中心进行服务注册。
[0040]本公开的第三方面提供了一种服务节点自隔离系统,包括:运维信息收集模块,用于定时获取服务节点的当前运维数据;
[0041]故障确定模块,用于根据所述当前运维数据确定故障节点;
[0042]故障判断模块,用于根据故障节点类型确定故障节点信息;
[0043]隔离策略确定模块,用于根据所述故障节点信息和预设节点配置信息确定隔离策略;以及
[0044]隔离执行模块,用于根据所述隔离策略对所述服务节点进行隔离。
[0045]本公开的第四方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于
存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述服务节点自隔离方法。
[0046]本公开的第五方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述服务节点自隔离方法。
[0047]本公开的第六方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述服务节点自隔离方法。
[0048]通过本公开实施例提供的服务节点自隔离方法,通过实时获取服务节点运维数据,节点主动判断故障节点类型确定故障节点信息,实现对web、app、DB节点的穿透式探活,防止节点以及链路上遗漏或假活;根据故障节点信息和预设节点配置信息确定对应的隔离策略,能够快速发现故障,执行隔离策略对故障节点的流量进行转发,实现异常情况下的自恢复能力,提升系统可靠性和用户使用体验。
附图说明
[0049]通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
[0050]图1示意性示出了根据本公开实施例的服务节点自隔离方法、系统、设备、介质和程序产品的应用场景图;
[0051]图2示意性示出了根据本公开实施例可以用于服务节点自隔离的方法的系统框架;
[0052]图3示意性示出了根据本公开实施例的服务节点自隔离方法的流程图;...

【技术保护点】

【技术特征摘要】
1.一种服务节点自隔离方法,其特征在于,所述方法包括:定时获取服务节点的当前运维数据;根据所述当前运维数据确定故障节点;根据故障节点类型确定故障节点信息;根据所述故障节点信息和预设节点配置信息确定隔离策略;以及根据所述隔离策略对所述服务节点进行隔离。2.根据权利要求1所述的方法,其特征在于,所述当前运维数据包括磁盘使用率和数据库节点探活脚本查询值,所述根据所述当前运维数据确定故障节点包括:若所述磁盘使用率大于第一阈值且数据库节点探活脚本查询值不为空或报错,则确定故障节点为服务节点;若数据库节点探活脚本查询值为空或报错,则确定故障节点为数据库节点和所述数据库节点对应的服务节点。3.根据权利要求2所述的方法,其特征在于,所述当前运维数据还包括JVM堆内存占用量、CPU使用率和内存使用率,所述根据所述当前运维数据确定故障节点还包括:根据三西格玛算法、历史运维数据和所述当前运维数据确定故障节点。4.根据权利要求3所述的方法,其特征在于,所述根据三西格玛算法、历史运维数据和所述当前运维数据确定故障节点包括:根据历史运维数据和三西格玛算法确定第二阈值和第三阈值;若当前运维数据大于第三阈值或小于第二阈值,则确定故障节点为服务节点。5.根据权利要求4所述的方法,其特征在于,所述根据故障节点类型确定故障节点信息包括:当确定所述故障节点为服务节点时,获取所述服务节点名称、IP地址和异常指标信息;当确定所述故障节点为数据库节点时,获取数据库节点名称。6.根据权利要求5所述的方法,其特征在于,所述预设节点配置信息包括服务节点与web节点的配置信息、软负载均衡与web节点的配置信息和服务节点与数据库节点的配置信息,所述根据所述故障节点信息和预设节点配置信息确定隔离策略包括:根据服务节点与web节点的配置信息确定与所述服务节点对应的web节点以及根据软负载均衡与web节点的配置信息确定与web节点的对应的软负载均衡;当确定web节点与所述服务节点为一对一关系时,获取软负载均衡下的其他web节点,将所述服务节点流量转发至所述其他web节点;当确定web节点与所述服务节点为一对多关系时,获取所述web节点下的其他服务节...

【专利技术属性】
技术研发人员:邓志丹顾亮赵于凡梁艳
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1