【技术实现步骤摘要】
平台监控与告警方法、装置、设备与计算机可读存储介质
本专利技术涉及通信领域,尤其涉及一种平台监控与告警方法、装置、设备与计算机可读存储介质。
技术介绍
随着互联网技术不断发展和进步,基于互联网的应用平台对应用平台的性能及处理能力的要求越来越高,分布式及集群环境使用的也越来越多,由此也带来了新的问题:对于分布式及集群环境中的应用程序和组件的工作状态的监控工作也越来越重要。现有的监控方法一般都只能监控平台上部署的应用或者组件是否存活,若检测到当前监控的应用或者组件处于未存活状态,则向用户发送告警信息,以使用户对平台及时进行运维。但是,采用上述方法对平台进行监控往往只能监控应用或者组件是否存活,但无法对应用或者组件的状态进行判断,因此,当应用或者组件当前运行状态发生故障时,无法及时通知用户进行运维,从而影响平台正常运行。举例来说,当平台上部署的应用或者组件当前出现僵尸进程时,现有监控方式认为进程为存活状态,因此,无法及时告警,进而影响平台正常运行。
技术实现思路
本专利技术提供一种平台监控与告警方法、装置、设备与计算机可读存储介质,用于解决现有技术中由于平台监控方法无法对应用或者组件的状态进行判断而导致应用或者组件当前运行状态发生故障时,无法及时通知用户进行运维,从而影响平台正常运行的技术问题。本专利技术的第一个方面是提供一种平台监控与告警方法,包括:定期读取监控平台配置文件中的待监控平台的配置信息,确定当前的待监控进程;定期采用不同的监控方式对不同的所述待监控进程进行监控;若监控到任一所述待监控进程出现故障,则向运维人员发送运维通知。本专利技术的另一个方面是提供一 ...
【技术保护点】
1.一种平台监控与告警方法,其特征在于,包括:定期读取监控平台配置文件中的待监控平台的配置信息,确定当前的待监控进程;定期采用不同的监控方式对不同的所述待监控进程进行监控;若监控到任一所述待监控进程出现故障,则向运维人员发送运维通知。
【技术特征摘要】
1.一种平台监控与告警方法,其特征在于,包括:定期读取监控平台配置文件中的待监控平台的配置信息,确定当前的待监控进程;定期采用不同的监控方式对不同的所述待监控进程进行监控;若监控到任一所述待监控进程出现故障,则向运维人员发送运维通知。2.根据权利要求1所述的方法,其特征在于,所述定期采用不同的监控方式对不同的所述待监控进程进行监控,包括:若所述待监控进程为数据库进程,则通过预设的数据库接口向所述数据库中添加一条数据,若能够成功删除所述数据,则判定所述数据库进程当前正常运行,若不能成功删除所述数据,则判定所述数据库进程当前出现故障;若所述待监控进程为加密机进程,则通过预设的加密机接口调用所述加密机的加密算法,若接收到所述加密机的反馈,则判定所述加密机进程当前正常运行;若未接收到所述加密机的反馈,则判定所述加密机进程当前出现故障;若所述待监控进程为第一应用进程,则通过预设的第一应用接口调用所述第一应用进程中预设的监控方法并接收所述第一应用进程的反馈信息,将所述反馈信息与预设的标准反馈信息进行比对,若一致,则判定所述第一应用进程当前正常运行,若不一致,则判定所述第一应用进程当前出现故障;若所述待监控进程为第二应用进程,则通过预设的第二应用进程接口调用所述第二应用进程的当前工作文件与上一工作文件,获取所述当前工作文件与上一工作文件的生成时间,若所述当前工作文件的生成时间在所述上一工作文件的生成时间之后,且接近于当前时间,则判定所述第二应用进程当前正常运行,若所述当前工作文件的生成时间与所述当前时间相差大于预设的阈值,则判定所述第二应用进程当前出现故障;若所述待监控进程为第三应用进程,则通过预设的第三应用进程接口访问所述第三应用进程返回当前系统时间的页面,若所述页面能够正常返回当前系统时间,则判定所述第三应用进程当前正常运行,若所述页面不能正常返回当前系统时间,则判定所述第三应用进程当前出现故障。3.根据权利要求1所述的方法,其特征在于,所述若监控到所述待监控进程出现故障,则向运维人员发送运维通知,包括:若监控到任一所述待监控进程出现故障,则确定出现故障的待监控进程的标识与故障时间;通过短信或者邮件的方式向所述运维人员发送所述运维通知,所述运维通知中包括所述待监控进程的标识故障时间。4.根据权利要求1所述的方法,其特征在于,所述定期读取监控平台配置文件中的待监控平台的配置信息之后,还包括:针对每一所述待监控进程,判断当前是否新增待监控节点,其中,每一所述待监控进程包括至少一个待监控节点;若是,则确定所述待监控节点的节点信息,将所述节点信息添加至当前的待监控进程对应的监控配置文件中,以实现对所述新增待监控节点的监控。5.根据权利要求1所述的方法,其特征在于,所述定期读取监控平台配置文件中的待监控平台的配置信息之后,还包括:确定当前是否新增待监控进程;若是,则接收运维人员开发的所述新增待监控进程的监控能力源码;将所述新增待监控进程的监控能力源码添加至当前待监控进...
【专利技术属性】
技术研发人员:邵辰龙,刘英伟,臧楠棋,杨旆,董利国,赫明岩,王学松,肖志玮,赵东辉,张轶慧,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。