【技术实现步骤摘要】
一种智能调度中的智能检测告警方法及装置
本专利技术涉及计算机
,尤其涉及一种智能调度中的智能检测告警方法及装置。
技术介绍
目前,在作业调度的过程中,存在作业运行失败,而在传统的作业调度系统中,一般只有作业运行失败之后才进行告警,这就导致在出现作业失败时,用户并不能马上获知自己的作业异常。而且导致作业运行失败的原因很多,可能是该作业本身的问题,也可能是执行机资源不足,服务组件异常,甚至MQ异常、Redis异常。对于作业运行失败,用户很难定位问题,开发人员进行问题排查时,也往往需要花费不少时间。而如果要成为高性能的作业调度系统就应该做到尽量避免作业运行失败。
技术实现思路
有鉴于此,本专利技术实施例提供一种智能调度中的智能检测告警方法及装置,实现了提前发现异常,降低作业的失败率,使运维人员能快速、准确地定位问题,确保调度系统高可用、高可靠性。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种智能调度中的智能检测告警的方法。本专利技术实施例的一种智能调度中的智能检测告警的方法包括: >根据需求配置检测告本文档来自技高网...
【技术保护点】
1.一种智能调度中的智能检测告警方法,其特征在于,包括:/n根据需求配置检测告警任务,将配置信息存入数据库;/n定时从所述数据库中获取检测告警任务信息;以及/n根据所述检测告警任务信息,进行相应检测告警。/n
【技术特征摘要】 【专利技术属性】
1.一种智能调度中的智能检测告警方法,其特征在于,包括:
根据需求配置检测告警任务,将配置信息存入数据库;
定时从所述数据库中获取检测告警任务信息;以及
根据所述检测告警任务信息,进行相应检测告警。
2.根据权利要求1所述的方法,其特征在于,配置检测告警任务包括配置告警对象、告警检测项和告警指标。
3.根据权利要求1所述的方法,其特征在于,根据所述告警任务信息进行相应检测告警包括:
从所述数据库中获取告警检测项;
对所获取的告警检测项进行检测;以及
根据检测结果,生成告警信息。
4.根据权利要求1所述的方法,其特征在于,根据所述告警任务信息进行相应检测告警进一步包括:
将所述告警信息发送到MQ的同时将所述告警信息存入告警信息表,以及
消费MQ队列中的告警信息,根据用户配置的告警模式和告警信息模板,进行告警。
5.根据权利要求4所述的方法,其特征在于
如果发送MQ队列失败,则直接进行短信告警。
6.根据权利要求4所述的方法,其特征在于
如果检测到同一个告警在一个时间段内被多次触发,则不再进行告警。
7.根据权利要求2所述的方法,其特征在于,所述告警对象包括:作业流、作业、MQ集群、Redis集群、服务节点和服务组件。
8.根据权利要求1所述的方法,其特征在于,所述作业流的检测告警方法包括:
获取作业流告警任务信息;
检测作业流实例化是否超时;
如果作业流实例化超时,则发送告警消息到告警MQ队列;以及
如果作业流实例化失败或作业流翻牌失败,则分别自动发送相应告警信息。
9.根据权利要求1所述的方法,其特征在于,所述作业的检测告警方法包括:
获取作业告警任务信息;
检测作业运行是否超时;
如果作业运行超时,则发送告警信息到告警MQ队列;以及
如果作业执行失败或作业派发失败,则分别自动发送相应告警信息。
10.根据权利要求1所述的方法,其特征在于,所述MQ集群的检测告警方法包括:
技术研发人员:高伟钦,陈守当,翁世清,
申请(专利权)人:中国建设银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。