一种预测服务节点异常状态的方法及装置制造方法及图纸

技术编号:37668267 阅读:15 留言:0更新日期:2023-05-26 04:28
一种预测服务节点异常状态的方法及装置,适用于分布式微服务系统,用以对每个服务节点的状态进行监控和推理预测,该方法包括:获取第一时刻下监控系统内各服务节点的运行状态;所述监控系统是以所述分布式微服务系统中作为监控对象的服务节点为中心构建的;根据所述各服务节点的运行状态与所述监控系统的状态转移矩阵,确定所述监控系统在第二时刻转换为各类设定状态的转换概率;所述状态转移矩阵是通过所述监控系统内各服务节点的历史运行状态得到的;从转换概率符合预设要求的设定状态中,确定异常状态对应的服务节点为所述第二时刻可能发生异常的服务节点。刻可能发生异常的服务节点。刻可能发生异常的服务节点。

【技术实现步骤摘要】
一种预测服务节点异常状态的方法及装置


[0001]本申请涉及运维
,尤其涉及一种预测服务节点异常状态的方法及装置。

技术介绍

[0002]在分布式微服务系统架构中,用户的一个请求进来,会依次经过不同的服务节点,处理完成后再返回结果给用户。在整个处理的链条中,如果有任何一个服务节点出现了延迟或者问题,都有可能导致最终的结果出现异常。现有的技术方案中,通常是在业务发生异常后再去对每个服务节点的状态进行排查。但由于分布式服务架构中,不同的服务节点可能是由不同的团队开发的、也可能部署在不同的服务器上。因此,随着业务系统功能上新越来越多,系统之间的关联关系越来越复杂,对于一笔业务异常,想要排查出是链条中的具体哪个服务节点出了问题,需要花费大量的时间。并且,在业务发生异常后再去对每个服务节点的状态进行排查,没有对每个服务节点可能出现的情况进行推理预测,以及时规避异常情况的发生。
[0003]因此,目前亟需一种方案,用以对每个服务节点的状态进行监控和推理预测。

技术实现思路

[0004]本申请提供一种预测服务节点异常状态的方法及装置,用以对每个服务节点的状态进行监控和推理预测。
[0005]第一方面,本申请提供一种预测服务节点异常状态的方法,该方法包括:获取第一时刻下监控系统内各服务节点的运行状态;所述监控系统是以所述分布式微服务系统中作为监控对象的服务节点为中心构建的;根据所述各服务节点的运行状态与所述监控系统的状态转移矩阵,确定所述监控系统在第二时刻转换为各类设定状态的转换概率;所述状态转移矩阵是通过所述监控系统内各服务节点的历史运行状态得到的;从转换概率符合预设要求的设定状态中,确定异常状态对应的服务节点为所述第二时刻可能发生异常的服务节点。
[0006]在一种可能的设计中,所述监控系统是以所述分布式微服务系统中作为监控对象的服务节点为中心构建的,包括:确定所述分布式微服务系统中的一个服务节点作为监控对象;从所述分布式微服务系统的系统关系图中选择与所述监控对象关联程度大于预设阈值的服务节点;所述系统关系图是通过所述分布式微服务系统中各服务节点的调用关系生成的;将所述监控对象和所述大于预设阈值的服务节点组成所述监控系统。
[0007]在一种可能的设计中,所述系统关系图是通过所述分布式微服务系统中各服务节点的调用关系生成的,包括:以所述分布式微服务系统中的各服务节点为顶点,所述分布式微服务系统中任意两个服务节点之间的调用关系为边,生成所述系统关系图;其中,任一边的权重为两个服务节点之间的调用次数。
[0008]在一种可能的设计中,从所述分布式微服务系统的系统关系图中选择与所述监控对象关联程度大于预设阈值的服务节点,包括:针对所述分布式微服务系统中的任一服务
节点,基于所述分布式微服务系统的系统关系图,确定所述服务节点至所述监控对象的各边的权重和;将权重和满足距离要求的服务节点,确定为与所述监控对象关联程度大于预设阈值的服务节点。
[0009]在一种可能的设计中,所述状态转移矩阵是通过所述监控系统内各服务节点的历史运行状态得到的,包括:采集所述监控系统内各服务节点在多个时刻的历史运行状态;针对各类设定状态中任一第一设定状态,统计所述历史运行状态中,所述监控系统在相邻时刻由所述第一设定状态转换为任一第二设定状态的次数;所述第一设定状态为所述监控系统的N类设定状态中的任一设定状态,所述第二设定状态为所述监控系统的N类设定状态中的任一设定状态;根据各第二设定状态的次数,确定所述第一设定状态对应的转换频率;根据各第一设定状态对应的转换频率,确定所述监控系统在一步转换下的状态转移矩阵。
[0010]在一种可能的设计中,根据所述各服务节点的运行状态与所述监控系统的状态转移矩阵,确定所述监控系统在第二时刻转换为各类设定状态的转换概率,包括:确定所述第一时刻与所述第二时刻的时间间隔数n;基于所述监控系统在一步转换下的状态转移矩阵经n步转换后,确定所述监控系统在各类设定状态的转换概率。
[0011]在一种可能的设计中,所述方法还包括:每间隔预设时间,更新所述监控系统的历史运行状态;根据更新后的历史运行状态,重新计算所述监控系统的状态转移矩阵。
[0012]第二方面,本申请实施例提供一种预测服务节点异常状态的装置,包括:
[0013]获取模块,用于获取第一时刻下监控系统内各服务节点的运行状态;所述监控系统是以所述分布式微服务系统中作为监控对象的服务节点为中心构建的;
[0014]处理模块,用于根据所述各服务节点的运行状态与所述监控系统的状态转移矩阵,确定所述监控系统在第二时刻转换为各类设定状态的转换概率;所述状态转移矩阵是通过所述监控系统内各服务节点的历史运行状态得到的;
[0015]所述处理模块,还用于从转换概率符合预设要求的设定状态中,确定异常状态对应的服务节点为所述第二时刻可能发生异常的服务节点。
[0016]在一种可能的设计中,所述监控系统是以所述分布式微服务系统中作为监控对象的服务节点为中心构建的,所述处理模块,还用于确定所述分布式微服务系统中的一个服务节点作为监控对象;从所述分布式微服务系统的系统关系图中选择与所述监控对象关联程度大于预设阈值的服务节点;所述系统关系图是通过所述分布式微服务系统中各服务节点的调用关系生成的;将所述监控对象和所述大于预设阈值的服务节点组成所述监控系统。
[0017]在一种可能的设计中,所述处理模块,还用于以所述分布式微服务系统中的各服务节点为顶点,所述分布式微服务系统中任意两个服务节点之间的调用关系为边,生成所述系统关系图;其中,任一边的权重为两个服务节点之间的调用次数。
[0018]在一种可能的设计中,所述处理模块,还用于针对所述分布式微服务系统中的任一服务节点,基于所述分布式微服务系统的系统关系图,确定所述服务节点至所述监控对象的各边的权重和;将权重和满足距离要求的服务节点,确定为与所述监控对象关联程度大于预设阈值的服务节点。
[0019]在一种可能的设计中,所述处理模块,还用于采集所述监控系统内各服务节点在多个时刻的历史运行状态;针对各类设定状态中任一第一设定状态,统计所述历史运行状
态中,所述监控系统在相邻时刻由所述第一设定状态转换为任一第二设定状态的次数;所述第一设定状态为所述监控系统的N类设定状态中的任一设定状态,所述第二设定状态为所述监控系统的N类设定状态中的任一设定状态;根据各第二设定状态的次数,确定所述第一设定状态对应的转换频率;根据各第一设定状态对应的转换频率,确定所述监控系统在一步转换下的状态转移矩阵。
[0020]在一种可能的设计中,所述处理模块,还用于确定所述第一时刻与所述第二时刻的时间间隔数n;基于所述监控系统在一步转换下的状态转移矩阵经n步转换后,确定所述监控系统在各类设定状态的转换概率。
[0021]在一种可能的设计中,所述装置还包括更新模块,用于每间隔预设时间,更新所述监控系统的历史运行状态;所述处理模块,还用根据更新后的历史运本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预测服务节点异常状态的方法,其特征在于,所述方法适用于分布式微服务系统,包括:获取第一时刻下监控系统内各服务节点的运行状态;所述监控系统是以所述分布式微服务系统中作为监控对象的服务节点为中心构建的;根据所述各服务节点的运行状态与所述监控系统的状态转移矩阵,确定所述监控系统在第二时刻转换为各类设定状态的转换概率;所述状态转移矩阵是通过所述监控系统内各服务节点的历史运行状态得到的;从转换概率符合预设要求的设定状态中,确定异常状态对应的服务节点为所述第二时刻可能发生异常的服务节点。2.根据权利要求1所述的方法,其特征在于,所述监控系统是以所述分布式微服务系统中作为监控对象的服务节点为中心构建的,包括:确定所述分布式微服务系统中的一个服务节点作为监控对象;从所述分布式微服务系统的系统关系图中选择与所述监控对象关联程度大于预设阈值的服务节点;所述系统关系图是通过所述分布式微服务系统中各服务节点的调用关系生成的;将所述监控对象和所述大于预设阈值的服务节点组成所述监控系统。3.根据权利要求2所述的方法,其特征在于,所述系统关系图是通过所述分布式微服务系统中各服务节点的调用关系生成的,包括:以所述分布式微服务系统中的各服务节点为顶点,所述分布式微服务系统中任意两个服务节点之间的调用关系为边,生成所述系统关系图;其中,任一边的权重为两个服务节点之间的调用次数。4.根据权利要求3所述的方法,其特征在于,从所述分布式微服务系统的系统关系图中选择与所述监控对象关联程度大于预设阈值的服务节点,包括:针对所述分布式微服务系统中的任一服务节点,基于所述分布式微服务系统的系统关系图,确定所述服务节点至所述监控对象的各边的权重和;将权重和满足距离要求的服务节点,确定为与所述监控对象关联程度大于预设阈值的服务节点。5.根据权利要求1至4任一项所述的方法,其特征在于,所述状态转移矩阵是通过所述监控系统内各服务节点的历史运行状态得到的,包括:采集所述监控系统内各服务节点在多个时刻的历史运行状态;针对各类...

【专利技术属性】
技术研发人员:蒋群华何威阳于文庆戎珈李伟
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1