告警生成方法和系统技术方案

技术编号:18304461 阅读:29 留言:0更新日期:2018-06-28 13:25
本发明专利技术提供了一种告警生成方法和系统。该告警生成方法是在云计算环境下基于大数据分析技术进行的。该方法包括:基于预定采集策略采集监控对象的运行数据以及至少一个关联对象的运行数据,其中关联对象是直接或间接地影响所述监控对象的运行状态的对象;基于预定数据分析策略获取预先存储的监控对象和至少一个关联对象的历史运行数据,并对所采集到的监控对象的运行数据以及至少一个关联对象的运行数据以及所获取的监控对象和至少一个关联对象的历史运行数据进行数据分析,得到监控对象的性能趋势及状态变化;基于告警策略对监控对象的性能趋势及状态变化进行智能告警分析决策,以判断是否生成告警。

Alarm generation method and system

The invention provides an alarm generation method and system. The alarm generation method is based on big data analysis technology in cloud computing environment. The method includes: collecting the running data of the monitored object based on the predetermined acquisition strategy and the running data of at least one associated object, in which the related object is the object that directly or indirectly affects the running state of the monitored object, and the pre stored monitoring object and at least one association based on the predefined data analysis strategy. The history data of the object is run, and the data of the running data of the monitored object, the running data of at least one related object, the monitored object and the history data of at least one related object are analyzed, and the performance trend and state change of the monitored object are obtained. The performance trend and state change of the controlled object are analyzed and judged by intelligent alarm to determine whether an alarm is generated.

【技术实现步骤摘要】
告警生成方法和系统
本专利技术一般地涉及云计算领域监控告警领域,更具体地涉及一种告警生成方法和系统。
技术介绍
随着云计算、大数据及分布式相关的技术落地,电信运营商设备数量及业务数量出现突变式的增长,告警类型和数量也越来越多,因此对资源监控和运维工作量也将剧增,如何更加准确定位故障告警、消除误告警、减少重复性告警并实现关联性告警则成为一个迫切需要解决的一个问题。现在大多数监控系统一般都采用阈值告警,其实现主要是通过对需要监控的指标设置一个门限值,当采集到指标数据大于设定值就会生成告警。为了对告警严重程度进行区分,也会对指标设置几个级别的值(一般、重要、严重、紧急等级别),这种告警技术会生成很多级别的告警,也容易生成误告警(如:指标出现一个瞬时值大于设定阈值,但随后指标就恢复正常),一些比较完善的监控系统如移动BOMC系统、电信ITSM系统,由CMDB、服务流程、基础平台监控、业务监控等多个配套系统组成,但其告警系统设计仍然脱离不了基于指标阈值告警模式,还没有实现告警智能化和动态化,其针对大批量告警、误告警处理措施仍采用后处理手段来解决。通过告警自动消除、告警自动升级、告警处理流程自动化及告警短信个性化订阅提醒等功能来解决问题,难以做到告警预防和预测分析。本专利技术在监控告警系统设计上引入大数据存储和计算技术,采用人工智能算法原理,建立一套基于推理树方式的告警决策分析模型,可以对告警生成的多种因素进行分析、整合,使得系统具备自我学习的能力,从而建立一套智能化告警系统。通过本专利技术建立的告警系统,可以提高告警准确性和全面性,有效减少重复告警和无效告警,解决告警分散无序问题,降低运维人员处理大量告警短信数量,实现故障告警精确定位,为系统快速、自动化运维提供很好数据和技术支撑。
技术实现思路
本专利技术提出了一种基于大数据技术智能告警系统设计和实现,通过引用大数据分析技术,采用“为监控对象建立监控模型及告警决策分析模型”的方式,充分利用采集的全量监控数据作为当前告警决策数据基础,并考虑告警之间的关联性,从而保障告警准确性和全面性。通过对监控对象生命周期及其所依赖的环境的全方位监控,并逐步建立告警评估参考知识库,可逐步建立起一个可自我学习告警系统。根据本专利技术实施例的告警生成方法,包括:基于预定采集策略采集监控对象的运行数据以及至少一个关联对象的运行数据,其中关联对象是直接或间接地影响所述监控对象的运行状态的对象;基于预定数据分析策略获取预先存储的监控对象和至少一个关联对象的历史运行数据并对所采集到的监控对象的运行数据以及至少一个关联对象的运行数据以及所获取的监控对象和至少一个关联对象的历史运行数据进行数据分析,得到监控对象的性能趋势及状态变化;基于告警策略对监控对象的性能趋势及状态变化进行智能告警分析决策,以判断是否生成告警。根据本专利技术实施例的告警生成系统,包括数据采集模块,被配置为基于预定采集策略采集监控对象的运行数据以及至少一个关联对象的运行数据,其中所述关联对象是直接或间接地影响所述监控对象的运行状态的对象;数据分析模块,被配置为基于预定数据分析策略获取预先存储的所述监控对象和所述至少一个关联对象的历史运行数据,并对所采集到的监控对象的运行数据以及至少一个关联对象的运行数据以及所获取的所述监控对象和所述至少一个关联对象的历史运行数据进行数据分析,得到所述监控对象的性能趋势及状态变化;告警决策模块,被配置为基于告警策略对所述监控对象的性能趋势及状态变化进行智能告警分析决策,以判断是否生成告警。采用本专利技术可以实现对历史监控数据进行全量分析,不仅可以对监控对象当前的状态进行合理的评估和告警决策,同时还可以对监控对象未来的运行状态进行预测,实现告警智能化和自动化,可以节省大量人工配置和故障处理工作,提高运维效率。采用本专利技术还可以解决告警过多、重复告警和无效告警问题,提高告警准确性。附图说明从下面结合附图对本专利技术的具体实施方式的描述中可以更好地理解本专利技术,其中:图1是示出根据本专利技术实施例的告警生成系统的框图;图2是示出根据本专利技术实施例的告警生成方法的流程图;图3是示出根据本专利技术实施例的告警分析模型的图示;图4是示出根据本专利技术实施例的大数据分析简化图;图5是示出根据本专利技术实施例的智能分析原理图;图6是示出根据本专利技术实施例的告警推理决策模型的图示;图7a是示出根据本专利技术实施例的基于告警分析模型的实施例的图示;图7b是示出根据本专利技术实施例的基于告警推理决策模型实现告警生成方法的实施例的图示。具体实施方式下面将结合附图详细描述本专利技术的各个方面的特征和示例性实施例。在下面的详细描述中,提出了许多具体细节,以便提供对本专利技术的全面理解。但是,对于本领域技术人员来说很明显的是,本专利技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本专利技术的示例来提供对本专利技术的更好的理解。本专利技术决不限于下面所提出的任何具体配置和算法,而是在不脱离本专利技术的精神的前提下覆盖了元素、部件和算法的任何修改、替换和改进。在附图和下面的描述中,没有示出公知的结构和技术,以便避免对本专利技术造成不必要的模糊。为了实现实时的智能告警,下面结合附图,详细描述了根据本专利技术实施例的告警生成方法和系统图1示出根据本专利技术实施例的告警生成系统100的框图。图2是示出根据本专利技术实施例的告警方法的流程图。如图1所示,根据本专利技术的实施例的告警系统包括,数据采集模块102,基于预定采集策略采集监控对象的运行数据以及至少一个关联对象的运行数据,其中所述关联对象是直接或间接地影响所述监控对象的运行状态的对象;数据分析模块104,基于预定数据分析策略获取预先存储的所述监控对象和所述至少一个关联对象的历史运行数据,并对所采集到的监控对象的运行数据以及至少一个关联对象的运行数据以及所获取的所述监控对象和所述至少一个关联对象的历史运行数据进行数据分析,得到所述监控对象的性能趋势及状态变化;告警决策模块106,基于告警策略对所述监控对象的性能趋势及状态变化进行智能告警分析决策,以判断是否生成告警。在一些实施例中,数据采集模块102负责监控数据采集,并通过消息中间件将采集的数据发送给数据处理引擎,所采集的数据包括例如,性能数据、告警数据、配置数据、业务数据和日志数据等。数据分析模块104,主要针对采集的数据获取相关的历史数据,以对当前运行数据及历史运行数据进行分析,并将得到的监控对象的性能趋势及状态变等分析结果输入到告警决策模块106,以判断是否告警,最终由智能告警引擎负责告警分析和处理,并生成告警。图2是示出根据本专利技术实施例的告警生成方法的流程图。在步骤202中,基于预定采集策略采集监控对象的运行数据以及至少一个关联对象的运行数据,其中关联对象是直接或间接地影响所述监控对象的运行状态的对象;在步骤204中,基于预定数据分析策略获取预先存储的监控对象和至少一个关联对象的历史运行数据,并对所采集到的监控对象的运行数据以及至少一个关联对象的运行数据以及所获取的监控对象和至少一个关联对象的历史运行数据进行数据分析,得到监控对象的性能趋势及状态变化;在步骤206中,基于告警策略对监控对象的性能趋势及状态变化进行智能告警分析决策,以判断是否生成告警。图3是示出根据本专利技术实施例的告警本文档来自技高网
...
告警生成方法和系统

【技术保护点】
1.一种告警生成方法,其特征在于,包括:基于预定采集策略采集监控对象的运行数据以及至少一个关联对象的运行数据,其中所述关联对象是直接或间接地影响所述监控对象的运行状态的对象;基于预定数据分析策略获取预先存储的所述监控对象和所述至少一个关联对象的历史运行数据,并对所采集到的监控对象的运行数据以及至少一个关联对象的运行数据以及所获取的所述监控对象和所述至少一个关联对象的历史运行数据进行数据分析,得到所述监控对象的性能趋势及状态变化;以及基于告警策略对所述监控对象的性能趋势及状态变化进行智能告警分析决策,以判断是否生成告警。

【技术特征摘要】
1.一种告警生成方法,其特征在于,包括:基于预定采集策略采集监控对象的运行数据以及至少一个关联对象的运行数据,其中所述关联对象是直接或间接地影响所述监控对象的运行状态的对象;基于预定数据分析策略获取预先存储的所述监控对象和所述至少一个关联对象的历史运行数据,并对所采集到的监控对象的运行数据以及至少一个关联对象的运行数据以及所获取的所述监控对象和所述至少一个关联对象的历史运行数据进行数据分析,得到所述监控对象的性能趋势及状态变化;以及基于告警策略对所述监控对象的性能趋势及状态变化进行智能告警分析决策,以判断是否生成告警。2.根据权利要求1中所述的告警生成方法,其特征在于,所述预定采集策略包括采集周期频率和采集方式中的一种或多种。3.根据权利要求1所述的告警生成方法,其特征在于,所述运行数据包括针对所述监控对象和所述关联对象预先设定的一个或多个性能指标以及所述一个或多个性能指标的权重。4.根据权利要求1所述的告警生成方法,其特征在于,获取预先存储的所述监控对象和所述至少一个关联对象的历史运行数据包括:获取第一周期的所述监控对象的历史运行数据,以及获取第二周期的所述至少一个关联对象的历史运行数据。5.根据权利要求1所述的告警生成方法,其特征在于,所述预定数据分析策略是基于大数据分析技术进行的。6.根据权利要求1所述的告警生成方法,其特征在于,所述告警策略包括单指标、多指标、单对象、多对象方式中一种或多种方式。7.根据权利要求1中任一所述的告警生成方法,其特征在于,所述智能告警分析决策包括:对所述监控对象的性能趋势及状态变化进行模糊运算,以得出与所述监控对象有关的一个或多个临时告警,再对所述一个或多个临时告警进行分类、分析、过滤、去重、对比、关联组合中的一项或多项的决策分析,以判断是否生成告警。8.一种告警生成系统,包括:数据采集模...

【专利技术属性】
技术研发人员:卢山李斌
申请(专利权)人:中国移动通信集团山西有限公司中国移动通信集团公司
类型:发明
国别省市:山西,14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1