用于云平台的全链路性能监控的方法和系统技术方案

技术编号:36919499 阅读:14 留言:0更新日期:2023-03-22 18:43
本公开提供了一种用于云平台的全链路性能监控的方法和系统。方法包括:对云平台的业务层、分布式应用层和基础设施层分别进行划分,以使得业务层、分布式应用层和基础设施层分别包括不同的节点;记录和监控每个节点的日志信息,日志信息包括节点被调用时的跟踪标识、调用的开始时间、调用方信息、请求的服务名、调用耗时和调用结果;将从云平台的用户层的客户端发起服务请求到服务器返回该服务请求的响应信息的过程中所调用的节点串联成调用链路,其中,调用链路包含唯一的跟踪标识;获得日志信息中与调用链路的跟踪标识对应的节点的调用耗时;以及根据与调用链路的跟踪标识对应的节点的调用耗时确定该节点是否出现故障。障。障。

【技术实现步骤摘要】
用于云平台的全链路性能监控的方法和系统


[0001]本公开涉及云平台
,特别涉及一种用于云平台的全链路性能监控的方法和系统。

技术介绍

[0002]云计算平台也称为云平台,是指以互联网为平台,将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的模式。随着互联网和云计算的不断发展,越来越多企业的基础设施、业务应用和系统平台开始向云平台上迁移,企业上云之后,云平台的服务请求涉及到多个业务系统,系统之间存在接口及互相调用的情况。当某个节点出现异常,很难定位上下游的调用关系,较难排查异常是由哪个节点调用产生的。

技术实现思路

[0003]本公开解决的一个技术问题是:现有技术无法实现对故障节点的定位。
[0004]鉴于此,本公开提供了一种用于云平台的全链路性能监控的方法或系统,以实现故障节点的定位。
[0005]根据本公开的一个方面,提供了一种用于云平台的全链路性能监控的方法,包括:对云平台的业务层、分布式应用层和基础设施层分别进行划分,以使得所述业务层、所述分布式应用层和所述基础设施层分别包括不同的节点;记录和监控每个节点的日志信息,所述日志信息包括节点被调用时的跟踪标识、调用的开始时间、调用方信息、请求的服务名、调用耗时和调用结果;将从所述云平台的用户层的客户端发起服务请求到服务器返回该服务请求的响应信息的过程中所调用的节点串联成调用链路,其中,所述调用链路包含唯一的跟踪标识;获得所述日志信息中与所述调用链路的跟踪标识对应的节点的调用耗时;以及根据与所述调用链路的跟踪标识对应的节点的调用耗时确定该节点是否出现故障。
[0006]在一些实施例中,根据与所述调用链路的跟踪标识对应的节点的调用耗时确定该节点是否出现故障的步骤包括:在与所述调用链路的跟踪标识对应的节点的调用耗时大于或等于阈值的情况下,确定该节点出现故障;以及在与所述调用链路的跟踪标识对应的节点的调用耗时小于所述阈值的情况下,确定该节点没有出现故障。
[0007]在一些实施例中,所述日志信息还包括协议类型和异常信息;所述调用方信息包括调用方的网际互连协议IP地址和端口。
[0008]在一些实施例中,所述方法还包括:根据出现故障的节点的日志信息中的异常信息确定该出现故障的节点的故障类型。
[0009]在一些实施例中,所述业务层包括不同的业务节点,所述分布式应用层包括不同的应用节点,所述基础设施层包括不同的基础设施节点。
[0010]根据本公开的另一个方面,提供了一种用于云平台的全链路性能监控的系统,包括:划分单元,用于对云平台的业务层、分布式应用层和基础设施层分别进行划分,以使得所述业务层、所述分布式应用层和所述基础设施层分别包括不同的节点;监控单元,用于记
录和监控每个节点的日志信息,所述日志信息包括节点被调用时的跟踪标识、调用的开始时间、调用方信息、请求的服务名、调用耗时和调用结果;链路获取单元,用于将从所述云平台的用户层的客户端发起服务请求到服务器返回该服务请求的响应信息的过程中所调用的节点串联成调用链路,其中,所述调用链路包含唯一的跟踪标识;调用耗时获取单元,用于获得所述日志信息中与所述调用链路的跟踪标识对应的节点的调用耗时;以及故障确定单元,用于根据与所述调用链路的跟踪标识对应的节点的调用耗时确定该节点是否出现故障。
[0011]在一些实施例中,所述故障确定单元用于在与所述调用链路的跟踪标识对应的节点的调用耗时大于或等于阈值的情况下,确定该节点出现故障,以及在与所述调用链路的跟踪标识对应的节点的调用耗时小于所述阈值的情况下,确定该节点没有出现故障。
[0012]在一些实施例中,所述日志信息还包括协议类型和异常信息;所述调用方信息包括调用方的网际互连协议IP地址和端口。
[0013]在一些实施例中,所述故障确定单元还用于根据出现故障的节点的日志信息中的异常信息确定该出现故障的节点的故障类型。
[0014]在一些实施例中,所述业务层包括不同的业务节点,所述分布式应用层包括不同的应用节点,所述基础设施层包括不同的基础设施节点。
[0015]根据本公开的另一个方面,提供了一种用于云平台的全链路性能监控的系统,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行如前所述的方法。
[0016]根据本公开的另一个方面,提供了一种云平台,包括:如前所述的用于云平台的全链路性能监控的系统。
[0017]根据本公开的另一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,该计算机程序指令被处理器执行时实现如前所述的方法。
[0018]在上述方法中,对云平台的业务层、分布式应用层和基础设施层分别进行划分,以使得业务层、分布式应用层和基础设施层分别包括不同的节点;记录和监控每个节点的日志信息,日志信息包括节点被调用时的跟踪标识、调用的开始时间、调用方信息、请求的服务名、调用耗时和调用结果;将从云平台的用户层的客户端发起服务请求到服务器返回该服务请求的响应信息的过程中所调用的节点串联成调用链路,其中,调用链路包含唯一的跟踪标识;获得日志信息中与调用链路的跟踪标识对应的节点的调用耗时;以及根据与调用链路的跟踪标识对应的节点的调用耗时确定该节点是否出现故障。该方法实现了对链路中故障节点的定位。
[0019]通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
[0020]构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。
[0021]参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
[0022]图1是示出根据本公开一些实施例的用于云平台的全链路性能监控的方法的流程
图;
[0023]图2是示出根据本公开另一些实施例的用于云平台的全链路性能监控的方法的流程示意图;
[0024]图3是示出根据本公开一些实施例的用于云平台的全链路性能监控的系统的结构示意图;
[0025]图4是示出根据本公开另一些实施例的用于云平台的全链路性能监控的系统的结构示意图;
[0026]图5是示出根据本公开另一些实施例的用于云平台的全链路性能监控的系统的结构示意图。
具体实施方式
[0027]现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
[0028]同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
[0029]以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
[0030]对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0031]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于云平台的全链路性能监控的方法,包括:对云平台的业务层、分布式应用层和基础设施层分别进行划分,以使得所述业务层、所述分布式应用层和所述基础设施层分别包括不同的节点;记录和监控每个节点的日志信息,所述日志信息包括节点被调用时的跟踪标识、调用的开始时间、调用方信息、请求的服务名、调用耗时和调用结果;将从所述云平台的用户层的客户端发起服务请求到服务器返回该服务请求的响应信息的过程中所调用的节点串联成调用链路,其中,所述调用链路包含唯一的跟踪标识;获得所述日志信息中与所述调用链路的跟踪标识对应的节点的调用耗时;以及根据与所述调用链路的跟踪标识对应的节点的调用耗时确定该节点是否出现故障。2.根据权利要求1所述的方法,其中,根据与所述调用链路的跟踪标识对应的节点的调用耗时确定该节点是否出现故障的步骤包括:在与所述调用链路的跟踪标识对应的节点的调用耗时大于或等于阈值的情况下,确定该节点出现故障;以及在与所述调用链路的跟踪标识对应的节点的调用耗时小于所述阈值的情况下,确定该节点没有出现故障。3.根据权利要求1所述的方法,其中,所述日志信息还包括协议类型和异常信息;所述调用方信息包括调用方的网际互连协议IP地址和端口。4.根据权利要求3所述的方法,还包括:根据出现故障的节点的日志信息中的异常信息确定该出现故障的节点的故障类型。5.根据权利要求1所述的方法,其中,所述业务层包括不同的业务节点,所述分布式应用层包括不同的应用节点,所述基础设施层包括不同的基础设施节点。6.一种用于云平台的全链路性能监控的系统,包括:划分单元,用于对云平台的业务层、分布式应用层和基础设施层分别进行划分,以使得所述业务层、所述分布式应用层和所述基础设施层分别包括不同的节点;监控单元,用于记录和监控每个节点的日...

【专利技术属性】
技术研发人员:王海霞李先绪黄植勤邱红飞郑文武朱海云黄春光陈辉
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1