System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及故障根因定位,尤其涉及一种微服务故障根因定位方法。
技术介绍
1、近年来提出的智能告警解决了部分故障管理的相关问题,但在目前的状态下绝大多数基于异常检测根因分析的故障定位仍然准确率不高,且无法分析故障原因,造成经济人力成本的增加以及运维效率降低下。在系统服务故障时进行根因分析来定位故障作为智能运维的一个关键环节,能够加快运维开发人员快速处理故障,使得服务正常运行,有效降低故障所造成的各种损失。
2、现有的监控告警平台如zabbix,prometheus等仅仅利用各主机的单一监控指标作为告警依据,各指标间缺乏逻辑关系,使得其在大型分布式微服务架构的复杂运维场景下的故障定位的准确率不高;其次,由于这些监控平台的监控指标是主机或服务层面,没有深入微服务内部,无法分析出故障的发生深层原因,使得在故障发生时还是需要运维人员去排查日志原因,极大延长了故障处理时间;
3、因此,本专利技术旨在提供一种微服务故障根因定位方法。
技术实现思路
1、本专利技术的目的在于提供一种微服务故障根因定位方法,利用链路追踪技术生成的服务调用图,相较于仅仅利用各主机的监控指标来推理生成的服务异常调用图,因果关系更强,准确度更高;相比现有平台主机或服务级别的定位,利用链路追踪的日志信息来进一步分析故障产生的深层次原因,使运维人员可以更高效地了解故障原因,缩短故障解决时间。
2、为了实现上述目的,本专利技术采用了如下技术方案:
3、本专利技术实施例提供了一种
4、s1、从链路追踪数据中直接生成服务调用链路图;
5、s2、从链路图中,利用监控到的告警数据,生成故障传播图;
6、s3、利用故障传播图推测故障根因服务的位置;
7、s4、找到故障根因服务后,结合日志利用机器学习算法分析故障原因;
8、s5、得到故障根因服务和原因后,将整个链路调用图通过平台展示出来,并在图中标注出故障传播图和根因服务,同时显示出故障原因,供运维人员参考。
9、作为本方案进一步的方案,步骤s3中利用故障传播图推测故障根因服务的位置具体步骤如下:
10、输入:故障传播图、服务性能指标数据、服务响应时间;
11、s31、依次遍历异常服务候选列表,计算各服务响应时间并生成矩阵;
12、s32、根据服务调用频率和服务性能指标做相关性计算,并生成相关性矩阵;
13、s33、为各个节点计算异常分数,计算公式如下:
14、
15、式中,as表示异常得分,uk表示主机资源利用率指标,notij表示服务响应时间,rt表示服务节点的平均权重;
16、s34、生成转移概率矩阵,计算公式如下;
17、
18、式中,p表示转移概率;
19、s35、根据pr计算并排序,计算公式如下:
20、r=(1-c)pr+cu
21、式中,r表示每个节点的根本原因得分,c∈(0,1)表示每一步以概率c跳回到随机节点,并以概率(1-c)沿着图继续前进,u表示节点的偏好向量;
22、输出:故障根因服务。
23、作为本方案进一步的方案,步骤s4中利用机器学习算法分析故障原因具体步骤如下:
24、s41、确定故障服务后,通过链路追踪的traceid获取故障服务在故障发生时的日志序列;
25、s42、使用doc2vec对日志进行向量化处理,提取日志特征;
26、s43、使用k-means模型对日志特征进行分类,确定故障原因。
27、相比于现有技术,本专利技术的有益效果在于:
28、1.利用链路追踪技术生成的服务调用图,相较于仅仅利用各主机的监控指标来推理生成的服务异常调用图,因果关系更强,准确度更高;
29、2.相比现有平台主机或服务级别的定位,本专利技术定位到故障服务后,可以利用链路追踪的日志信息来进一步分析故障产生的深层次原因,使运维人员可以更高效地了解故障原因,缩短故障解决时间。
本文档来自技高网...【技术保护点】
1.一种微服务故障根因定位方法,其特征在于,该定位方法具体步骤如下:
2.根据权利要求1所述的一种微服务故障根因定位方法,其特征在于,步骤S3中利用故障传播图推测故障根因服务的位置具体步骤如下:
3.根据权利要求1所述的一种微服务故障根因定位方法,其特征在于,步骤S4中利用机器学习算法分析故障原因具体步骤如下:
【技术特征摘要】
1.一种微服务故障根因定位方法,其特征在于,该定位方法具体步骤如下:
2.根据权利要求1所述的一种微服务故障根因定位方法,其特征在于,步骤s3中利用故障传播...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。