一种基于故障相似度的服务可靠性保障方法技术

技术编号:26797410 阅读:40 留言:0更新日期:2020-12-22 17:14
本发明专利技术提供一种基于故障相似度的服务可靠性保障方法,包括:解析一执行追踪,构建有向带权图;将所述有向带权图与通过若干正常执行追踪构建的若干正常有向带权图比较,判断该执行追踪是否正常;若该执行追踪为故障执行追踪,将执行追踪中所调用的服务根据调用顺序,得到未知故障请求字符串;提取已知故障数据库中故障调用字符串,并与未知故障请求字符串进行相似度计算,得到该执行追踪的故障原因;依据故障原因,检测所述服务失效类型是否存在;所述服务失效类型若存在,则重启服务;所述服务失效类型若不存在,则获取服务容器度量指标,进行服务容器的自适应匹配。本发明专利技术基于定向故障注入,实现执行追踪与故障原因相挂钩,判断监测节点故障。

【技术实现步骤摘要】
一种基于故障相似度的服务可靠性保障方法
本专利技术属于软件
,具体涉及一种基于故障相似度的服务可靠性保障方法。
技术介绍
面对互联网时代的海量请求,短时间内的服务失效会导致用户体验和评价的下降,而长时间的服务失效甚至会使企业面临严重的经济损失。随着云计算数据量的迅速增长,集群规模的不断膨胀,集群的高可靠性成为了一个变得越来越重要的技术。服务可靠性是指在给定时间内,特定环境下软件无错运行的概率,准确度量可靠性需要对时间、运行环境与条件、以及功能进行规定。服务的监测与故障技术帮助运维人员监测分布式服务集群中容器的运行情况,进行资源的调配,保证整个服务系统的可靠运行。服务可靠性保障方法主要包含分析度量信息、日志文件和执行追踪等三种方法。基于度量信息分析的方法收集某个逻辑计量单元或某时间段内的计量值,可以通过设定固定的指标或是通过一系列运算设定动态变化的指标,以此作为系统异常的报警规则,向运维人员发送异常警告,或是作为集群任务的调度规则。具有代表性的方法包括文献(S.ChouliarasandS.Sotiriadis,"Real-Time本文档来自技高网...

【技术保护点】
1.一种基于故障相似度的服务可靠性保障方法,其步骤包括:/n1)解析系统运行时生成的一执行追踪,构建有向带权图,其中,有向带权图中的顶点使用一[服务id,服务请求端id,调用服务端id,请求消耗时间,方法其他信息]多元组表示,方法其他信息使用一[服务名称,开始时间戳,请求所包含的标签]多元组表示。有向边为

【技术特征摘要】
1.一种基于故障相似度的服务可靠性保障方法,其步骤包括:
1)解析系统运行时生成的一执行追踪,构建有向带权图,其中,有向带权图中的顶点使用一[服务id,服务请求端id,调用服务端id,请求消耗时间,方法其他信息]多元组表示,方法其他信息使用一[服务名称,开始时间戳,请求所包含的标签]多元组表示。有向边为a代表服务请求端标识符,b代表调用服务端标识符,有向边权重向量为请求消耗时间;
2)将所述有向带权图与通过若干正常执行追踪构建的若干正常有向带权图比较,通过请求消耗时间与正常请求消耗时间,判断该执行追踪是否正常;
3)若该执行追踪为故障执行追踪,将执行追踪中所调用的服务根据调用顺序,依次将各服务名称转化为对应的定长字符串,并依据调用顺序进行拼接,得到未知故障请求字符串;
4)提取已知故障数据库中已知故障的所有故障调用字符串,并将未知故障请求字符串与各故障调用字符串进行相似度计算,得到该执行追踪的故障原因;
5)依据故障原因,获取相应的服务失效类型,检测所述服务失效类型是否存在;
6)所述服务失效类型若存在,则重启服务;所述服务失效类型若不存在,则获取服务容器度量指标,进行服务容器的自适应匹配。


2.如权利要求1所述的方法,其特征在于,通过将Mixer指定的执行追踪收集组件接口zipkin-address-url设为Jaeger的开放接口,收集所述执行追踪。


3.如权利要求1所述的方法,其特征在于,所述已知故障数据库通过下述步骤建立:
a)将若干样本故障注入正常运行时的系统,发送若干请求,得到若干已知故障执行追踪;
b)构建若干该已知故障执行追踪的已知故障有向带权图;
c)对所有已知故障有向带权图根据其故障原因进行归类,得到若干已知故障有向带权图组合,形成已知故障数据库。


4.如权利要求1所述的方法,其特征在于,通过以下步骤判断该执行追踪是否正常:
1)通过若干正常有向带权图的各有向边权重向量,计算正常请求消耗时间的上限值和下限值其中表示n个正常执行追踪的正常请求消耗时间平均执...

【专利技术属性】
技术研发人员:王焘陈皓张文博许源佳
申请(专利权)人:中国科学院软件研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1