平台监控与告警方法、装置、设备与计算机可读存储介质制造方法及图纸

技术编号:19511183 阅读:23 留言:0更新日期:2018-11-21 07:43
本发明专利技术提供一种平台监控与告警方法、装置、设备与计算机可读存储介质,方法包括:定期读取监控平台配置文件中的待监控平台的配置信息,确定当前的待监控进程;定期采用不同的监控方式对不同的所述待监控进程进行监控;若监控到任一所述待监控进程出现故障,则向运维人员发送运维通知。从而能够实现对待监控平台内全部待监控进程的监控,并提醒运维人员及时进行运维,提高了待监控平台的安全性。

【技术实现步骤摘要】
平台监控与告警方法、装置、设备与计算机可读存储介质
本专利技术涉及通信领域,尤其涉及一种平台监控与告警方法、装置、设备与计算机可读存储介质。
技术介绍
随着互联网技术不断发展和进步,基于互联网的应用平台对应用平台的性能及处理能力的要求越来越高,分布式及集群环境使用的也越来越多,由此也带来了新的问题:对于分布式及集群环境中的应用程序和组件的工作状态的监控工作也越来越重要。现有的监控方法一般都只能监控平台上部署的应用或者组件是否存活,若检测到当前监控的应用或者组件处于未存活状态,则向用户发送告警信息,以使用户对平台及时进行运维。但是,采用上述方法对平台进行监控往往只能监控应用或者组件是否存活,但无法对应用或者组件的状态进行判断,因此,当应用或者组件当前运行状态发生故障时,无法及时通知用户进行运维,从而影响平台正常运行。举例来说,当平台上部署的应用或者组件当前出现僵尸进程时,现有监控方式认为进程为存活状态,因此,无法及时告警,进而影响平台正常运行。
技术实现思路
本专利技术提供一种平台监控与告警方法、装置、设备与计算机可读存储介质,用于解决现有技术中由于平台监控方法无法对应用或者组件的状态进行判断而导致应用或者组件当前运行状态发生故障时,无法及时通知用户进行运维,从而影响平台正常运行的技术问题。本专利技术的第一个方面是提供一种平台监控与告警方法,包括:定期读取监控平台配置文件中的待监控平台的配置信息,确定当前的待监控进程;定期采用不同的监控方式对不同的所述待监控进程进行监控;若监控到任一所述待监控进程出现故障,则向运维人员发送运维通知。本专利技术的另一个方面是提供一种平台监控与告警装置,包括:读取模块,用于定期读取监控平台配置文件中的待监控平台的配置信息,确定当前的待监控进程;监控模块,用于定期采用不同的监控方式对不同的所述待监控进程进行监控;通知模块,用于若监控到任一所述待监控进程出现故障,则向运维人员发送运维通知。本专利技术的又一个方面是提供一种平台监控与告警设备,包括:存储器,处理器;存储器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为:定期读取监控平台配置文件中的待监控平台的配置信息,确定当前的待监控进程;定期采用不同的监控方式对不同的所述待监控进程进行监控;若监控到任一所述待监控进程出现故障,则向运维人员发送运维通知。本专利技术的又一个方面是提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现上述的平台监控与告警方法。本专利技术提供的平台监控与告警方法、装置、设备与计算机可读存储介质,通过定期读取监控平台配置文件中的待监控平台的配置信息,确定当前待监控进程,并采用不同的监控方式对当前确定的全部待监控进程进行监控,并在监控到任一待监控进程出故障的时候,向运维人员发送运维通知,从而能够实现对待监控平台内全部待监控进程的监控,进而能够解决现有技术中由于平台监控方法无法对应用或者组件的状态进行判断而导致应用或者组件当前运行状态发生故障时,无法及时通知用户进行运维,从而影响平台正常运行的技术问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1为本专利技术实施例一提供的平台监控与告警方法的流程示意图;图2为本专利技术实施例二提供的平台监控与告警方法的流程示意图;图3为本专利技术实施例三提供的平台监控与告警装置的结构示意图;图4为本专利技术实施例四提供的平台监控与告警装置的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术实施例一提供的平台监控与告警方法的流程示意图,如图1所示,所述方法包括:步骤101、定期读取监控平台配置文件中的待监控平台的配置信息,确定当前的待监控进程。在本实施方式中,为了实现对待监控平台的监控,可以读取监控平台配置文件中的待监控平台的配置信息,从而能够根据该配置文件确定当前待监控的进程。进一步地,由于随着平台的运行,随时都有可能出现故障,因此,为了保障平台的正常运行,可以定期地读取监控平台配置文件中的待监控平台的配置信息,确定当前是否有新增的需要被监控的待监控进程。具体地,定期读取待监控平台的时间可以由用户自行设置,举例来说,可以根据待监控平台的重要程度为不同的待监控平台设置不同的读取配置文件的时间,若待监控平台处理的业务较为重要,则可以为其设置较短的读取配置文件的时间,以保障该待监控平台能够正常运行,若待监控平台处理的业务重要度一般,则可以为其设置较长的读取配置文件的时间,以达到节约资源的效果。此外,读取监控平台配置文件中的待监控平台的配置信息之后,还可以对当前监控模块数据进行初始化,以实现对获取到的待监控进程的监控。步骤102、定期采用不同的监控方式对不同的所述待监控进程进行监控。在本实施方式中,定期读取监控平台配置文件中的待监控平台的配置信息,确定当前的待监控进程之后,需要对当前全部待监控进程进行监控,具体地,为了增加监控的准确性,可以对不同的待监控进程采用不同的监控方式,其中待监控进程包括待监控应用进程与待监控组件进程,从而能够实现对待监控平台中所有的组件与应用当前运行进程的监控。需要说明的是,定期对待监控进程进行监控的时间可以由用户自行设置,其可以与定期读取待监控平台配置文件的时间一致,也可以不一致,本专利技术在此不做限制。步骤103、若监控到任一所述待监控进程出现故障,则向运维人员发送运维通知。在本实施方式中,若定期采用不同的监控方式对不同的待监控进程进行监控之后,若监控得出任一个待监控进程出现故障,则可以向运维人员发送运维通知,以使运维人员根据该运维通知对出故障的进程进行及时运维,此外,还可以使运维人员对当前平台的运行状态进行及时了解。本实施例提供的平台监控与告警方法,通过定期读取监控平台配置文件中的待监控平台的配置信息,确定当前待监控进程,并采用不同的监控方式对当前确定的全部待监控进程进行监控,并在监控到任一待监控进程出故障的时候,向运维人员发送运维通知,从而能够实现对待监控平台内全部待监控进程的监控,进而能够避免现有技术中由于平台监控方法无法对应用或者组件的状态进行判断而导致应用或者组件当前运行状态发生故障时,无法及时通知用户进行运维,从而影响平台正常运行的技术问题。进一步地,在上述实施例的基础上,步骤102具体包括:若所述待监控进程为数据库进程,则通过预设的数据库接口向所述数据库中添加一条数据,若能够成功删除所述数据,则判定所述数据库进程当前正常运行,若不能成功删除所述数据,则判定所述数据库进程当前出现故障;若所述待监控进程为加密机进程,则通过预设的加密机接口调用所述加密机的加密算法,若接收到所述加密机的反馈,则判定所述加密机进程当前正常运行;若未接收到所述加密机的反馈,则判定所述加密机进程当前出现故本文档来自技高网...

【技术保护点】
1.一种平台监控与告警方法,其特征在于,包括:定期读取监控平台配置文件中的待监控平台的配置信息,确定当前的待监控进程;定期采用不同的监控方式对不同的所述待监控进程进行监控;若监控到任一所述待监控进程出现故障,则向运维人员发送运维通知。

【技术特征摘要】
1.一种平台监控与告警方法,其特征在于,包括:定期读取监控平台配置文件中的待监控平台的配置信息,确定当前的待监控进程;定期采用不同的监控方式对不同的所述待监控进程进行监控;若监控到任一所述待监控进程出现故障,则向运维人员发送运维通知。2.根据权利要求1所述的方法,其特征在于,所述定期采用不同的监控方式对不同的所述待监控进程进行监控,包括:若所述待监控进程为数据库进程,则通过预设的数据库接口向所述数据库中添加一条数据,若能够成功删除所述数据,则判定所述数据库进程当前正常运行,若不能成功删除所述数据,则判定所述数据库进程当前出现故障;若所述待监控进程为加密机进程,则通过预设的加密机接口调用所述加密机的加密算法,若接收到所述加密机的反馈,则判定所述加密机进程当前正常运行;若未接收到所述加密机的反馈,则判定所述加密机进程当前出现故障;若所述待监控进程为第一应用进程,则通过预设的第一应用接口调用所述第一应用进程中预设的监控方法并接收所述第一应用进程的反馈信息,将所述反馈信息与预设的标准反馈信息进行比对,若一致,则判定所述第一应用进程当前正常运行,若不一致,则判定所述第一应用进程当前出现故障;若所述待监控进程为第二应用进程,则通过预设的第二应用进程接口调用所述第二应用进程的当前工作文件与上一工作文件,获取所述当前工作文件与上一工作文件的生成时间,若所述当前工作文件的生成时间在所述上一工作文件的生成时间之后,且接近于当前时间,则判定所述第二应用进程当前正常运行,若所述当前工作文件的生成时间与所述当前时间相差大于预设的阈值,则判定所述第二应用进程当前出现故障;若所述待监控进程为第三应用进程,则通过预设的第三应用进程接口访问所述第三应用进程返回当前系统时间的页面,若所述页面能够正常返回当前系统时间,则判定所述第三应用进程当前正常运行,若所述页面不能正常返回当前系统时间,则判定所述第三应用进程当前出现故障。3.根据权利要求1所述的方法,其特征在于,所述若监控到所述待监控进程出现故障,则向运维人员发送运维通知,包括:若监控到任一所述待监控进程出现故障,则确定出现故障的待监控进程的标识与故障时间;通过短信或者邮件的方式向所述运维人员发送所述运维通知,所述运维通知中包括所述待监控进程的标识故障时间。4.根据权利要求1所述的方法,其特征在于,所述定期读取监控平台配置文件中的待监控平台的配置信息之后,还包括:针对每一所述待监控进程,判断当前是否新增待监控节点,其中,每一所述待监控进程包括至少一个待监控节点;若是,则确定所述待监控节点的节点信息,将所述节点信息添加至当前的待监控进程对应的监控配置文件中,以实现对所述新增待监控节点的监控。5.根据权利要求1所述的方法,其特征在于,所述定期读取监控平台配置文件中的待监控平台的配置信息之后,还包括:确定当前是否新增待监控进程;若是,则接收运维人员开发的所述新增待监控进程的监控能力源码;将所述新增待监控进程的监控能力源码添加至当前待监控进...

【专利技术属性】
技术研发人员:邵辰龙刘英伟臧楠棋杨旆董利国赫明岩王学松肖志玮赵东辉张轶慧
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1