The invention discloses a system and a monitoring and alarm method comprises the following steps: acquiring monitoring data; analysis of monitoring data by monitoring model, the results of the analysis; analysis to determine whether the results meet the preset condition; if meet, then the alarm; monitoring model based on Spark framework, using historical monitoring data, the first relationship between failure the probability and historical monitoring data, using the corresponding relationship, get monitoring model. The present invention by monitoring data acquisition monitoring object, based on the Spark framework, the corresponding relationship between failure probability and history monitoring data through historical monitoring data, monitoring model is made to analyze the monitoring data, the results of the analysis, and then determine whether the analysis results meet the preset condition, if satisfying the preset conditions, alarm to sum up, and realized before failure, according to the data analysis of possible fault and alarm in advance, so as to avoid the occurrence or expansion of fault.
【技术实现步骤摘要】
一种监测告警方法及系统
本专利技术涉及大数据分析领域,特别涉及一种监测告警方法及系统。
技术介绍
随之科技的进步,大数据分析被应用到各个领域,大规模的监测系统也适用于大数据分析领域。Spark是由加州伯克利大学AMP实验室开发的分布式并行计算框架,主要特点是弹性分布式数据集,中间输出结果可以保存在内存中,节省了大量的磁盘I/O操作。除此之外还支持多次迭代计算,特别适合流计算和图计算。传统的监控告警方案一般是使用Ganglia+Nagios,收集系统和网络的各种数据日志,加以分析,上报故障警告。但是此种传统的监控告警方式有许多弊端。首先监控日志数据量非常大,但是能被运维人员利用到的只有一小部分,大部分数据占据存储空间但没有被利用。其次告警准确度和效率低下,通常告警需要工程师设置告警条件,但是条件的粒度很难把握,这样的告警机制很死板,尤其是针对复杂的业务监控,告警经常漏报和误报。最后传统的运监系统只能被动的提示故障,却不能主动的规避故障,这往往让用户处在很被动的状态。因此,如何能够在故障发生前进行告警,规避故障,成为了研究难点。
技术实现思路
有鉴于此,本专利技术的目的在 ...
【技术保护点】
一种监测告警方法,其特征在于,包括:获取监测数据;利用监测模型分析所述监测数据,得到分析结果;判断所述分析结果是否满足预设条件;如果满足,则进行告警;其中,所述监测模型为基于Spark框架,利用历史监测数据,得到故障发生概率与所述历史监测数据的第一对应关系,利用所述第一对应关系,得到所述监测模型。
【技术特征摘要】
1.一种监测告警方法,其特征在于,包括:获取监测数据;利用监测模型分析所述监测数据,得到分析结果;判断所述分析结果是否满足预设条件;如果满足,则进行告警;其中,所述监测模型为基于Spark框架,利用历史监测数据,得到故障发生概率与所述历史监测数据的第一对应关系,利用所述第一对应关系,得到所述监测模型。2.根据权利要求1所述的监测告警方法,其特征在于,所述监测数据包括监测日志和运维人员的操作日志。3.根据权利要求1所述的监测告警方法,其特征在于,所述监测模型创建过程,包括:对所述历史监测数据逐条进行SQL统计分析,并将具有联系的数据建立关联,得到故障发生概率与所述历史监测数据的第一对应关系,利用所述第一对应关系,得到所述监测模型。4.根据权利要求1至3任一项所述的监测告警方法,其特征在于,所述监测模型训练过程,还包括:对所述历史监测数据逐条进行SQL统计分析,并将具有联系的数据建立关联,得到故障与所述历史监测数据的第二对应关系,利用所述第二对应关系,得到所述监测模型。5.根据权利要求1至3任一项所述的监测告警方法,其特征在于,还包括:接收用户输入的过滤列表;停止对所述过滤列表中记录的故障告警。6.根据权利要求1至3任一项所述的监测告警方法,其特征在于,还包括:利用历史告警信息,分析出高频告警列表;按照预...
【专利技术属性】
技术研发人员:殷武烁,袁鹏飞,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。