链路跟踪系统中的报警方法及装置制造方法及图纸

技术编号:20925880 阅读:19 留言:0更新日期:2019-04-20 11:45
本发明专利技术公开了链路跟踪系统中的报警方法及装置,获取所述链路跟踪系统中的性能数据、日志数据和链路数据中的至少一种;分析获取的数据;在分析结果满足预设的报警条件时,推送报警消息。本发明专利技术及时分析链路跟踪系统中的数据,在根据预设的报警条件检测到有异常发生时,推送报警消息,提升了系统的可靠性和安全性。

Alarm Method and Device in Link Tracking System

The invention discloses an alarm method and device in a link tracking system, obtains at least one of the performance data, log data and link data in the link tracking system, analyses the acquired data, and pushes an alarm message when the analysis results meet the preset alarm conditions. The invention timely analyses the data in the link tracking system, pushes the alarm message when abnormal occurrence is detected according to the preset alarm conditions, and improves the reliability and security of the system.

【技术实现步骤摘要】
链路跟踪系统中的报警方法及装置
本专利技术涉及链路跟踪领域,特别涉及链路跟踪系统中的报警方法及装置。
技术介绍
在分布式/微服务应用场景下,服务运行质量通常用分布式链路跟踪系统来监控。分布式链路跟踪系统采集的数据主要有三种:性能数据(Metrics)、日志数据(Logging)和链路数据(Tracing)。需要通过收集到的数据,识别并预警故障。
技术实现思路
本专利技术实施例提供了链路跟踪系统中的报警方法及装置。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。第一方面,本专利技术实施例提供了一种链路跟踪系统中的报警方法,所述方法包括:获取所述链路跟踪系统中的性能数据、日志数据和链路数据中的至少一种;分析获取的数据;在分析结果满足预设的报警条件时,推送报警消息。基于所述方法,作为可选的第一实施例,所述预警条件包括如下至少一种:是否满足设定阈值条件;是否在固定时间段内的异常比率超过设定值;是否在连续区间的偏离度超过设定值;是否在设定时间内失去响应;是否事件状态为错误;是否数据占用率低于设定值;是否数据不可用。基于所述方法,作为可选的第二实施例,所述方法还包括:接收所述报警消息的反馈消息;根据所述反馈消息,更改所述报警消息的生命周期。基于所述第二实施例,作为可选的第三实施例,所述根据所述反馈消息,更改所述报警消息的生命周期,包括:当所述反馈消息指示所述报警消息已确收时,将所述报警消息的生命周期更改为确认;当所述反馈消息指示所述报警消息对应的异常已解决时,将所述报警消息的生命周期更改为解决。基于所述第三实施例,作为可选的第四实施例,所述方法还包括:所述将报警消息的生命周期更改为解决之后,确认所述报警消息对应的异常是否已解决;当所述报警消息对应的异常未解决时,将所述报警消息的生命周期更改为确认。基于所述方法,作为可选的第五实施例,所述推送报警消息包括:选择预设的推送插件,推送所述报警消息。第一方面,本专利技术实施例提供了一种链路跟踪系统中的报警装置,所述装置包括:数据查询模块,用于获取所述链路跟踪系统中的性能数据、日志数据和链路数据中的至少一种;分析获取的数据;消息推送模块,用于在分析结果满足预设的报警条件时,推送报警消息。基于所述装置,作为可选的第一实施例,所述消息推送模块还用于:接收所述报警消息的反馈消息;根据所述反馈消息,更改所述报警消息的生命周期。基于所述第二实施例,作为可选的第三实施例,所述消息推送模块,在所述反馈消息指示所述报警消息已确收时,将所述报警消息的生命周期更改为确认;在所述反馈消息指示所述报警消息对应的异常已解决时,将所述报警消息的生命周期更改为解决。基于所述第三实施例,作为可选的第四实施例,所述消息推送模块还用于:在将所述报警消息的状态更改为解决之后,触发所述数据查询模块确认所述报警消息对应的异常是否已解决;在所述报警消息对应的异常未解决时,将所述报警消息的生命周期更改为确认。在本专利技术实施例中,及时分析链路跟踪系统中的数据,在根据预设的报警条件检测到有异常发生时,推送报警消息,提升了系统的可靠性和安全性。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。图1是一示例性实施例示出的链路跟踪系统中的报警方法流程图;图2是一示例性实施例示出的链路跟踪系统中的报警方法流程图;图3是一示例性实施例示出的链路跟踪系统中的报警装置框图。具体实施方式以下描述和附图充分地示出本专利技术的具体实施方案,以使本领域的技术人员能够实践它们。实施例仅代表可能的变化。除非明确要求,否则单独的部件和功能是可选的,并且操作的顺序可以变化。一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本专利技术的实施方案的范围包括权利要求书的整个范围,以及权利要求书的所有可获得的等同物。在本文中,各实施方案可以被单独地或总地用术语“专利技术”来表示,这仅仅是为了方便,并且如果事实上公开了超过一个的专利技术,不是要自动地限制该应用的范围为任何单个专利技术或专利技术构思。本文中,诸如第一和第二等之类的关系术语仅仅用于将一个实体或者操作与另一个实体或操作区分开来,而不要求或者暗示这些实体或操作之间存在任何实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素。本文中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。在一示例性实施例中,如图1所示,链路跟踪系统中的报警方法包括如下步骤。在步骤11中,获取链路跟踪系统中的性能数据、日志数据和链路数据中的至少一种。在步骤12中,分析获取的数据。在步骤13中,在分析结果满足预设的报警条件时,推送报警消息。在本示例性实施例中,及时分析链路跟踪系统中的数据,在根据预设的报警条件检测到有异常发生时,推送报警消息,提升了系统的可靠性和安全性。在一示例性实施例中,如图2所述,链路跟踪系统中的报警方法包括如下步骤。在步骤21中,获取链路跟踪系统中性能数据、日志数据和链路数据中的至少一种。在链路跟踪系统中,性能数据被保存到ES数据库,日志数据和链路数据被保存到时序数据库,本步骤中的获取数据,即从上述两个数据库中获取。获取数据的频率可以由预设的警报触发频率来决定,即按照预设的警报触发频率开始报警流程。在步骤22中,分析获取的数据。本步骤分析获取的数据的目的,是判断获取的数据是否满足预设的报警条件,以确定是否需要推送报警消息。报警条件可以灵活定义,下面表一给出一些举例,这些举例中所给出的条件可以使用一项,也可以使用几项的组合。表一在步骤23中,在分析结果满足预设的报警条件时,推送报警消息。本步骤中的推送报警消息,在满足预设的报警条件时进行,推送可以通过消息推送中间件进行,推送到指定的人员和/或组。上述指定人员和/或组可以预先确定。上述消息推送中间件可以自定义,包括邮件插件、短信插件、Kafka插件、WebHook插件和ES插件等。链路跟踪系统中也可以添加新的插件,具体通过创建新项目、添加接口、添加插件名称和处理包含为的传入操作消息这些步骤来实现。下面给出一个添加新的插件的应用实例,包含如下1-4步。1.创建一个新项目hawkular-alerts-actions-plugins。2.添加org.hawkular.alerts.actions.api.ActionPluginListener接口的实现。3.使用org.hawkular.alerts.actions.api.ActionPlugin注释向实现添加插件名称。4.处理包含为的传入操作消息org.hawkular.alerts.actions.api.ActionMessage。在步骤24中,接收报警消息的反馈消息。本步骤中,报警消息被推送到指定的人员和/或组之本文档来自技高网...

【技术保护点】
1.一种链路跟踪系统中的报警方法,其特征在于,所述方法包括:获取所述链路跟踪系统中的性能数据、日志数据和链路数据中的至少一种;分析获取的数据;在分析结果满足预设的报警条件时,推送报警消息。

【技术特征摘要】
1.一种链路跟踪系统中的报警方法,其特征在于,所述方法包括:获取所述链路跟踪系统中的性能数据、日志数据和链路数据中的至少一种;分析获取的数据;在分析结果满足预设的报警条件时,推送报警消息。2.如权利要求1所述的方法,其特征在于,所述预警条件包括如下至少一种:是否满足设定阈值条件;是否在固定时间段内的异常比率超过设定值;是否在连续区间的偏离度超过设定值;是否在设定时间内失去响应;是否事件状态为错误;是否数据占用率低于设定值;是否数据不可用。3.如权利要求1所述的方法,其特征在于,所述方法还包括:接收所述报警消息的反馈消息;根据所述反馈消息,更改所述报警消息的生命周期。4.如权利要求3所述的方法,其特征在于,所述根据所述反馈消息,更改所述报警消息的生命周期,包括:当所述反馈消息指示所述报警消息已确收时,将所述报警消息的生命周期更改为确认;当所述反馈消息指示所述报警消息对应的异常已解决时,将所述报警消息的生命周期更改为解决。5.如权利要求4所述的方法,其特征在于,所述方法还包括:所述将报警消息的生命周期更改为解决之后,确认所述报警消息对应的异常是否已解决;当所述报警消息对...

【专利技术属性】
技术研发人员:王雪松李弋
申请(专利权)人:北京奥鹏远程教育中心有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1