分布式服务集群的异常诊断方法和装置制造方法及图纸

技术编号:17346095 阅读:40 留言:0更新日期:2018-02-25 11:10
本发明专利技术提出一种分布式服务集群的异常诊断方法和装置,其中,方法包括:实时监测每个服务节点的敏感日志,从敏感日志中提取关键信息,从关键信息中提取服务节点当前所执行的第一请求的标识码;根据每个服务节点的地址信息,获取分布式服务集群的服务拓扑图;根据标识码和服务拓扑图,获取第一请求的全链路信息;根据全链路信息识别请求所隶属的服务类型;根据全链路信息中每个服务节点的关键信息和服务类型,对第一请求进行异常诊断,得到诊断结果。该方法能够实现无需对所有的日志进行侵入式收集,仅通过监测敏感日志,在保证准全量信息诊断的同时,还可以保证系统的低开销。此外,通过实时监测敏感日志,可以实现问题诊断的实时性和全面性。

【技术实现步骤摘要】
分布式服务集群的异常诊断方法和装置
本专利技术涉及互联网
,尤其涉及一种分布式服务集群的异常诊断方法和装置。
技术介绍
在互联网技术的飞速发展过程中,通过分布式服务集群化部署抵挡互联网服务业务量的快速增长的冲击,即将大量的服务节点进行功能的整合和拆分,以满足大量的业务使用。由于分布式服务集群化部署的规模较大、各个服务节点间访问链路较长,以及问题诊断的方式较为复杂,因此,对于分布式服务集群进行快速且实时的问题诊断显得尤为重要。目前应用成熟的分布式服务集群的异常诊断系统主要为Google的Dapper系统以及Twitter的Zipkin系统。对于日益增加的异构系统的复杂性而言,Dapper和Zipkin系统,一方面,需要进行侵入式的日志收集,而后对接入的服务做对应的代码修改才能生效,这对于成熟且运行长久的分布式服务集群而言,成本太高;另一方面,通过对采样数据进行过滤,虽然对于大规模问题诊断而言,十分有效,但却难以发现低概率的错误,可能导致对问题跟踪的疏漏。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种分布式服务集群的本文档来自技高网...
分布式服务集群的异常诊断方法和装置

【技术保护点】
一种分布式服务集群的异常诊断方法,其特征在于,包括以下步骤:实时监测每个服务节点的敏感日志,从所述敏感日志中提取关键信息,从所述关键信息中提取所述服务节点当前所执行的第一请求的标识码;根据每个服务节点的地址信息,获取分布式服务集群的服务拓扑图;根据所述标识码和所述服务拓扑图,获取所述第一请求的全链路信息;其中,所述全链路信息中包括处理所述第一请求所需的所述服务节点以及所述服务节点之间的调用关系;根据所述全链路信息识别所述请求所隶属的服务类型;根据所述全链路信息中每个服务节点的所述关键信息和所述服务类型,对所述第一请求进行异常诊断,得到诊断结果。

【技术特征摘要】
1.一种分布式服务集群的异常诊断方法,其特征在于,包括以下步骤:实时监测每个服务节点的敏感日志,从所述敏感日志中提取关键信息,从所述关键信息中提取所述服务节点当前所执行的第一请求的标识码;根据每个服务节点的地址信息,获取分布式服务集群的服务拓扑图;根据所述标识码和所述服务拓扑图,获取所述第一请求的全链路信息;其中,所述全链路信息中包括处理所述第一请求所需的所述服务节点以及所述服务节点之间的调用关系;根据所述全链路信息识别所述请求所隶属的服务类型;根据所述全链路信息中每个服务节点的所述关键信息和所述服务类型,对所述第一请求进行异常诊断,得到诊断结果。2.根据权利要求1所述的分布式服务集群的异常诊断方法,其特征在于,所述根据所述全链路信息中每个服务节点的所述关键信息和所述服务类型,对所述第一请求进行异常诊断,得到诊断结果,包括:获取所述全链路信息中每个服务节点的所述关键信息;对所有的所述关键信息进行特征提取,利用提取出的特征构成特征集合;获取与所述服务类型匹配的诊断策略;基于所述诊断策略对所述特征集合进行诊断,得到所述诊断结果。3.根据权利要求2所述的分布式服务集群的异常诊断方法,其特征在于,所述从所述关键信息中提取所述服务节点当前所执行的第一请求的标识码之后,还包括:将所述标识码与预设的标识码列表进行比较;如果所述标识码存在于所述标识码列表中,将所述服务节点的所述关键信息存储到所述标识码对应的存储空间中;其中,具有相同标识码的所述服务节点的所述关键信息存储在同一存储空间中。4.根据权利要求3所述的分布式服务集群的异常诊断方法,其特征在于,还包括:如果所述标识码未存在于所述标识码列表中,则在所述标识码列表中增加所述标识码;增加与所述标识码对应的所述存储空间,将所述服务节点的所述关键信息存储到增加的所述存储空间中。5.根据权利要求3所述的分布式服务集群的异常诊断方法,其特征在于,所述获取所述全链路信息中每个服务节点的所述关键信息,包括:获取所述全链路信息中所述服务节点的所述标识码;根据所述标识码查询到所述存储空间,从所述存储空间获取到每个服务节点的所述关键信息。6.根据权利要求1-5任一项所述的分布式服务集群的异常诊断方法,其特征在于,所述从所述敏感日志中提取关键信息,从所述关键信息中提取所述服务节点当前所执行第一请求的标识码,包括:利用正则表达式对所述关键信息进行结构化处理,得到结构化信息;从所述结构化信息中提取所述服务节点所对应的标识...

【专利技术属性】
技术研发人员:田健杨阔王仁达覃安齐志宏
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1