一种基于日志数据的网管故障诊断方法技术

技术编号:14853470 阅读:67 留言:0更新日期:2017-03-18 20:29
本发明专利技术涉及一种基于日志数据的网管故障诊断方法,现有的方法在工程维护中存在速度和效率方面的问题。本发明专利技术预先设计日志文件关键字格式,且后续结合关键字进行数据抽取,并结合不同的IP地址仿真不同网元链路数据发送,灵活控制发送间隔。如果发现异常,可锁定记录异常帧,用于问题解决之后的结果验证,通过数据帧仿真来减少人力和设备资源依赖,保证系统故障快速排查及故障是否排除的快速验证确认,从而提高工程维护效能和服务质量。

【技术实现步骤摘要】

本专利技术涉及通信领域中的网管监控技术,尤其涉及大量设备维护背景下OMC(Operationmanagementcenter,操作维护中心)网管系统的故障排查解决办法。本专利技术能够在文件日志数据中抽取关键数据帧,仿真设备交互流程,从而对故障进行重现,快速定位解决存在的问题。
技术介绍
目前网管系统中记录了所管理网元的数据交互日志,跟普通的日志效用类似,这些日志详细记录了处理流程出错原因。通过分析日志数据,能基本明确故障原因所在,原有的日志文件故障排查流程如下:1.网管应用程序依据程序执行分支情况,及执行函数返回失败的错误码和错误描述信息,写入日志文件;2.当故障出现时,调取运行输出的日志文件,人为查看日志文件;3.结合日志文件的错误失败描述,明确造成故障的原因;4.再根据故障原因描述搜索代码,确定错误位置但是,随着长时间运行交互累积,日志文件信息量越来越大,这对人工查看分析带来了较大困难。另外,日志分析的最大目的还是要解决潜在的问题,但记录出错原因只能明确一个方向,并不能准确定位出程序异常位置,也不能明确问题修改是否真实解决,往往需同实际网元联测,浪费人力物力,缺乏便捷有效的验证方式。
技术实现思路
本专利技术的目的是为了克服上述存在的问题和不足,提供了一种基于日志数据的OMC故障诊断方法。本专利技术采用的技术方案如下:一种基于日志数据的网管故障诊断方法,预先设置日志文件格式,通过文件导入操作,依据日志关键字收集抽取数据帧记录;结合不同的网元编号、IP地址确定网元终端数,并对应归结网元终端数据集,形成发送数据帧列表;每产生一个新的编号、IP地址就创建一条新的socket链路,并控制网元终端的数据发送频度、逐条发送列表中的数据帧,直到抽取的日志记录数据帧全部回放完毕;诊断发现问题后,通过锁定指定的异常数据帧构造故障场景,点击发送,快速验证故障是否重新出现,确认问题是否真实排除解决。具体方法如下:步骤S1.网管应用程序调整日志文件数据生成。增加日志关键字:TCP-SEND、TCP-RECEIVE,记录同网元交互的发送帧和接收帧,并附加记录网元编号,IP地址等网元标识性属性信息,为后续网元数据分发归类打好基础。日志文件生成上结合文件大小和生成时间分文件,并把文件生成的日期时间写入文件名中,便于后期筛选具体故障时间段的文件。步骤S2.结合现场故障场景,确定故障发生的时间,核查生成的日志文件目录,并结合日志文件名时间,挑选故障相关时间区间的日志文件数据。避免重现区间过大,可抽取故障前1小时左右的数据文件。步骤S3.加载日志文件数据,结合步骤S1设定的关键字内容,逐行解析日志内容,抽取存在关键字的记录行,排除其它日志数据。即收集此段时间区间的各网元同网管进程交互的TCP净荷,结合不同网元编号和IP地址,并形成各自的TCP净荷数据帧列表。如图1步骤S3。步骤S4.通过数据仿真的方式发送各网元数据,即各网元并不是实际存在,只是把网元编号和IP代表一个虚拟网元,因此它们只是一个索引代号,最终各网元是通过同一IP不同的端口来跟网管进程建立通信链路。结合不同的网元IP,统计确定网元数目,从而建立对等数目的TCP链路,并顺序对应链路同网元编号的对应关系,结合步骤S3生成的发送数据帧列表,逐个发送网元数据给网管进程。步骤S5.启动网管程序为调试运行,按照网元与网管的通信协议,逐个封包发送交互数据帧,便于程序单步跟踪,通过定时器控制TCP净荷发送速度,当网管程序出现异常时,结合调试工具,直接定位代码位置并明确异常的数据帧,解决存在的问题。步骤S6.验证问题是否解决;结合步骤S5确定的异常数据帧,通过指定输入方式,重新锁定发送该异常数据帧,验证问题是否正确解决。与现有技术相比,本专利技术充分考虑日志文件过大带来的问题,避免繁琐的搜索查看过程。该方法把日志文件数据自动化抽取,不需要人为分析日志内容,充分构造故障复现的场景,并且重在故障的复现和问题解决上,为程序跟踪调试、结果验证提供环境支撑,节省人力物力,从而提升OMC网管监控系统故障诊断的效能。附图说明图1为本专利技术的流程图。具体实施方式下面结合附图1进一步说明本专利技术。如图1步骤S1:网管进程不只是记录操作流程的成功失败,另外也实时将OMC与网元终端之间的交互数据帧存储下来,并按照特殊的关键字来设定存储格式。通过TCP-SEND、TCP-RECEIVE表明TCP净荷数据发送的方向,用网元终端编号、IP地址来表征网元终端唯一标识,并按照数据采集的开始时间作为文件名,基于设定大小分文件存储。经过这样的预设计,能够为文件过滤和数据内容过滤提供依据,可为后续数据抽取提供检索基础。一是结合故障日期确定只需从大量日志文件中选择相关日期时间范围文件,避免不相关数据干扰。二是结合关键字格式,只需日志文件内容中抽取网元实际发送的交互数据,从而过滤操作流程等错误描述等不相关日志数据。如图1步骤S2:结合步骤S1的前期准备,一旦知晓网管进程异常退出的时间,便可以提取相关日期范围的日志文件进行故障重现。如图1步骤S3:导入文件功能,逐行读取解析数据行,抽取OMC网管接收到的数据,作为数据发送目标集。每读入一行数据帧,均获取数据帧相关的网元编号和IP。读入下一行时首先判断是否是重复的网元编号及IP,如果是,则把该数据帧归集到同一个网元终端。如果不是则新建立一个网元终端,并统计网元终端数。如此循环读取,直到目标日志文件集数据初始化完毕。最终形成各自的TCP净荷数据帧列表。如图1步骤S4:通过上面的日志文件初始化处理,就可明确网元终端数,以及每个网元终端具体需要发送的数据帧列表。按照终端数去创建匹配的数据链路数,并顺序对应链路同网元终端的关联,通过不同的链路发送各自网元的数据帧列表,达到仿真网元终端链路发送数据帧的目的。这样通过此过程,把交互数据帧日志进行回放,从而构造异常场景,为图1步骤S5提供调试环境支撑。如图1步骤S5:当网管进程出现异常时,可就地调试查看代码异常点,确定异常原因,同时确定实际造成异常的数据帧。若问题得到解决之后,计划要测试验证,则并不需要重新再复现一遍。如图1步骤S6:提供了指定发送数据帧的功能,只需锁定异常数据帧,重新发送给OMC网管系统,直接运行验证即可。本专利技术通过上述处理可以大幅度提高OMC网管故障的排查效率。因为异常的原因有很多,不容易确定到底是哪一种,如果能把异常场景在调试环境中再现,对问题解决是非常有利的,问题排查的难点是确定问题在哪里,而OMC故障诊断方法则是要解决这样的一个问题。它通过再现异常数据场景,提供实时、直观具体的异常信息,为程序调试定位、故障诊断高效解决提供有力保障。本文档来自技高网...
一种基于日志数据的网管故障诊断方法

【技术保护点】
一种基于日志数据的网管故障诊断方法,其特征在于:预先设置日志文件格式,通过文件导入操作,依据日志关键字收集抽取数据帧记录;结合不同的网元编号、IP地址确定网元终端数,并对应归结网元终端数据集,形成发送数据帧列表;每产生一个新的编号、IP地址就创建一条新的socket链路,并控制网元终端的数据发送频度、逐条发送列表中的数据帧,直到抽取的日志记录数据帧全部回放完毕;诊断发现问题后,通过锁定指定的异常数据帧构造故障场景,发送异常数据帧给网管系统,快速验证故障是否重新出现,确认问题是否真实排除解决。

【技术特征摘要】
1.一种基于日志数据的网管故障诊断方法,其特征在于:预先设置日志文件格式,通过文件导入操作,依据日志关键字收集抽取数据帧记录;结合不同的网元编号、IP地址确定网元终端数,并对应归结网元终端数据集,形成发送数据帧列表;每产生一个新的编号、IP地址就创建一条新的socket链路,并控制网元终端的数据发送频度、逐条发送列表中的数据帧,直到抽取的日志记录数据帧全部回放完毕;诊断发现问题后,通过锁定指定的异常数据帧构造故障场景,发送异常数据帧给网管系统,快速验证故障是否重新出现,确认问题是否真实排除解决。2.根据权利要求1所述的一种基于日志数据的网管故障诊断方法,其特征在于;具体包括以下步骤:步骤S1、网管应用程序调整日志文件数据生成;增加日志关键字:TCP-SEND、TCP-RECEIVE,记录同网元交互的发送帧和接收帧,并附加记录网元编号,IP地址等网元标识性属性信息,为后续网元数据分发归类打好基础;日志文件生成上结合文件大小和生成时间分文件,并把文件生成的日期时间写入文件名中,便于后期筛选具体故障时间段的文件;步骤...

【专利技术属性】
技术研发人员:熊海潮王立胡涛
申请(专利权)人:武汉虹信通信技术有限责任公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1