基于网管代理的网络管理方法及装置制造方法及图纸

技术编号:8685356 阅读:154 留言:0更新日期:2013-05-09 05:01
本发明专利技术公开了一种基于网管代理的网络管理方法及装置,所述方法包括:根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标;根据所述网管代理模块的所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,则检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,则在所述网管代理模块中删除预先定义的故障进程;将所述网管代理模块的所述预处理标志设置为已预处理。和现有技术相比,本发明专利技术提出的基于网管代理的网络管理方法及装置,可以快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性。

【技术实现步骤摘要】
基于网管代理的网络管理方法及装置
本专利技术涉及网络管理技术,特别涉及一种基于网管代理的网络管理方法及装置。
技术介绍
网管系统是互联网系统中的一个重要组成部分,对于随时掌握庞大互联网中网络设备的运行状况、发现和解决网络设备的故障以及优化和提高网络设备的性能,网管系统都有着不可或缺的重要作用。在目前网管系统中采用的网管监控采集方式分为无网管代理的监控采集方式和基于网管代理的监控采集方式。其中,无网管代理的监控采集方式是通过标准的网络管理协议将管理设备和被管理设备连接起来,从管理设备中发出网管操作指令来直接获取被管理设备在运行过程中的运行数据;而基于网管代理的监控采集方式是在被管理设备中设置网管代理模块,管理设备向位于被管理系统中的网管代理模块发送网管操作指令,并且接收所述网管代理模块发送的被管理设备的运行数据,管理设备通过该网管代理模块来管理被管理设备。在基于网管代理的监控采集方式中,可以通过对网管代理模块进行二次开发来扩展其监控采集能力,因此,基于网管代理的监控采集方式成为目前网管系统中采用的主流方式。在采用基于网管代理的监控采集方式时,如何保障网管代理模块的稳定性,一直是困扰网管系统的一个技术难题。图1为现有技术基于网管代理的监控采集方式中的交叉监控采集方法流程图。如图1所示,管理设备和网管代理模块之间的信息交换可以分为两种:管理设备向网管代理模块发送网管操作指令以及网管代理模块向管理设备发送被管理设备的运行数据。其中,管理设备和被管理设备中的网管代理模块之间的通信遵从SNMP协议(SimpleNetworkManagementProtocol,简单网络管理协议)。对于管理设备向网管代理模块发送网管操作指令的流程,首先管理设备向位于被管理系统中的网管代理模块A发送网管操作指令,管理设备接收网管代理模块A发送的被管理设备的运行数据,管理设备通过网管代理模块A来管理被管理设备。为了保障网管代理模块A的稳定性,可以在被管理设备中设置网管代理模块B,此时,管理设备首先向位于被管理系统中的网管代理模块B发送网管操作指令,网管代理模块B将所述网管操作指令发送给网管代理模块A,由网管代理模块A来管理被管理设备;当管理设备在接收被管理设备的运行数据时,首先由网管代理模块A获取被管理设备的运行数据,然后将所述运行数据发送给网管代理模块B,再由网管代理模块B发送给管理设备。在实现本专利技术的过程中,专利技术人发现现有技术中至少存在如下问题:在现有的基于网管代理的监控采集方式中的交叉监控采集方法,由于网管代理模块A和网管代理模块B在通常情况下是一个生产厂家生产的设备,所以网管代理模块A和网管代理模块B通常会出现同样的故障,因此,采用现有的基于网管代理的监控采集方式中的交叉监控采集方法,仍然无法快速判断网管代理模块是否发生异常,不能保证网管代理模块A在运行过程中的稳定性。
技术实现思路
有鉴于此,本专利技术的主要目的在于提供一种基于网管代理的网络管理方法,可以快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性。本专利技术的另一目的在于提供一种基于网管代理的网络管理装置,可以快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性。为达到上述目的,本专利技术的技术方案是这样实现的:一种基于网管代理的网络管理方法,该方法包括:根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标;根据所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,则检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,则在所述网管代理模块中删除预先定义的故障进程;将所述网管代理模块中的所述预处理标志设置为已预处理。一种基于网管代理的网络管理装置,包括:获取单元,用于根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标,将所述两个以上运行指标发送给判断单元;所述判断单元,用于根据所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,向检查单元发送一个检查指令;所述检查单元,用于在接收到所述检查指令之后,检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,向删除单元发送一个删除指令;所述删除单元,用于在接收到所述删除指令之后,在所述网管代理模块中删除预先定义的故障进程,并向设置单元发送一个第一设置指令;所述设置单元,用于在接收到所述第一设置指令之后,将所述网管代理模块中的所述预处理标志设置为已预处理。本专利技术提出的基于网管代理的网络管理方法及装置,首先根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标,根据所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,则检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,则在所述网管代理模块中删除预先定义的故障进程,将所述网管代理模块中的所述预处理标志设置为已预处理。和现有技术相比,本专利技术提出的基于网管代理的网络管理方法及装置,可以快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性,而且可扩展性很强,实现方式简便可靠。附图说明图1为现有技术基于网管代理的监控采集方式中的交叉监控采集方法流程图。图2为本专利技术基于网管代理的网络管理方法第一实施例的实现流程图。图3为本专利技术根据网管代理模块的运行时间来判断网管代理模块是否发生异常的方法流程图。图4为本专利技术根据网管代理模块的数据采集时间来判断网管代理模块是否发生异常的方法流程图。图5为本专利技术基于网管代理的网络管理装置的组成结构示意图。具体实施方式针对现有技术中存在的问题,本专利技术中提出一种改进后的基于网管代理的网络管理方法及装置,可以快速判断网管代理模块是否发生异常,能够提高网管代理模块在运行过程中的稳定性。为使本专利技术的技术方案更加清楚、明白,以下参照附图并举实施例,对本专利技术所述方案作进一步地详细说明。图2为本专利技术基于网管代理的网络管理方法第一实施例的实现流程图。如图2所示,包括以下步骤:步骤201,根据预设的读取周期,从被管理设备中的网管代理模块中获取网管代理模块在运行过程中的两个以上运行指标。在本步骤中,网管代理模块在运行过程中的两个以上运行指标可以为网管代理模块中网管进程的在线状态以及所述网管进程占用的系统资源。具体地,通过向被管理设备中的网管代理模块发送进程状态获取指令来获取网管代理模块中网管进程的在线状态,以及通过向网管代理模块发送资源获取指令,来获取所述网管进程占用的系统资源。例如,可以通过向网管代理模块发送psef进程状态获取指令来获取网管代理模块中的网管进程的在线状态;另外,可以通过向网管代理模块发送top资源获取指令来获取网管代理模块占用CPU的百分比;还可以通过向网管代理模块发送glance资源获取指令来获取网管代理模块占用内存的百分比。步骤202,根据网管代理模块的两个以上运行指标,判断网管代理模块是否发生异常,如果所述网管代理模块发生异常,则检查所述网管代理模块的预处理本文档来自技高网
...
基于网管代理的网络管理方法及装置

【技术保护点】
一种基于网管代理的网络管理方法,其特征在于,包括:根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标;根据所述网管代理模块的所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,则检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,则在所述网管代理模块中删除预先定义的故障进程;将所述网管代理模块的所述预处理标志设置为已预处理。

【技术特征摘要】
1.一种基于网管代理的网络管理方法,其特征在于,包括:根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标;根据所述网管代理模块的所述两个以上运行指标,判断所述网管代理模块是否发生异常,如果所述网管代理模块发生异常,则检查所述网管代理模块的预处理标志是否为未预处理,如果所述预处理标志为未预处理,则在所述网管代理模块中删除预先定义的故障进程;将所述网管代理模块的所述预处理标志设置为已预处理;其中,根据所述网管代理模块的所述两个以上运行指标,判断所述网管代理模块是否发生异常,包括:判断所述网管代理模块中的网管进程是否在线,以及所述网管进程占用的系统资源是否大于或等于预设阈值;判定所述网管进程在线且所述网管进程占用的系统资源小于所述预设阈值,从所述网管代理模块的运行日志中获取所述网管代理模块的最后一个运行周期结束的系统时间,并获取所述网管代理模块所在系统的当前系统时间;计算所述当前系统时间与所述最后一个运行周期结束的系统时间的运行时间差值;确定所述运行时间差值大于或等于所述网管代理模块的一个运行周期,判定所述网管代理模块发生异常。2.根据权利要求1所述的方法,其特征在于,所述根据所述两个以上运行指标,判断所述网管代理模块是否发生异常,还包括:确定所述网管进程掉线,或者所述网管进程占用的系统资源大于或等于所述预设阈值,则判定所述网管代理模块发生异常。3.根据权利要求1所述的方法,其特征在于,所述根据所述两个以上运行指标,判断所述网管代理模块是否发生异常,还包括:确定所述运行时间差值小于所述网管代理模块的一个运行周期,从所述网管代理模块的数据采集日志中获取所述网管代理模块的最后一个数据采集周期结束的系统时间,并获取所述网管代理模块所在系统的当前系统时间;计算所述当前系统时间与所述最后一个数据采集周期结束的系统时间的数据采集时间差值;判断所述数据采集时间差值是否大于所述网管代理模块的一个数据采集周期,如果是,则判定所述网管代理模块发生异常。4.根据权利要求1所述的方法,其特征在于,还包括:如果所述预处理标志已经被设置为已处理,获取所述网管代理模块在运行过程中的异常数据;向管理设备发送一个告警通知,所述告警通知中携带有所述异常数据;将所述网管代理模块的预处理标志设置未已预处理。5.一种基于网管代理的网络管理装置,其特征在于,包括:获取单元,用于根据预设的读取周期,从被管理设备中的网管代理模块中获取所述网管代理模块在运行过程中的两个以上运行指标,将所述两个以上运行指标发送给判断单元;所述判断单元,用于根据所述两个以上运行指标,判断所述网...

【专利技术属性】
技术研发人员:李凯项捷王黎明
申请(专利权)人:中国移动通信集团浙江有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1