System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于事件日志的自主式实时故障隔离方法技术_技高网

一种基于事件日志的自主式实时故障隔离方法技术

技术编号:40546494 阅读:5 留言:0更新日期:2024-03-05 19:04
本申请提供一种基于事件日志的自主式实时故障隔离方法,包括:从IT运维事件日志中提取异常模式并标记可能的故障源点;根据已标记的异常模式,构建一个智能过滤器,从日常日志中筛选出与故障相关的日志;使用加权有向图,将标记为异常的日志视为图中的边,系统组件视为节点,构建故障传播图;在故障传播图中,快速定位核心故障节点和其关联节点;量化核心故障节点对服务的影响力,以确定哪些节点需要优先恢复;针对核心故障节点和关联节点,设计隔离策略,阻断与健康节点的连接,以防止故障进一步扩散;建立恢复策略并在模拟环境中进行验证,确保其可以有效地恢复故障节点而不影响其他与之有依赖关系的健康节点。

【技术实现步骤摘要】

本专利技术涉及信息,尤其涉及一种基于事件日志的自主式实时故障隔离方法


技术介绍

1、随着信息技术的快速发展,企业和组织面临着越来越多的it运维事件。这些事件日志通常以海量的形式存在,包含了大量的信息。然而,从这些海量日志中准确地提取出异常模式,并准确地标记可能的故障源点是一个具有挑战性的问题。当前的方法往往依赖于it专家的经验和手动分析来进行故障识别和隔离。这不仅增加了操作复杂性和时间成本,而且可能因为分析的局限性导致故障不能被完全准确地识别。许多现有的方法缺乏自动化和智能化特性,无法快速准确地从海量日志中提取出异常模式,并准确地标记可能的故障源点。这使得故障处理过程变得低效,且可能错过一些潜在的故障源点。一些现有的方法无法实现实时监控和隔离故障,只能在事后对日志进行分析。这可能导致故障影响扩大,增加了修复成本和时间。由于海量日志的复杂性和多样性,现有的方法可能无法准确地识别出异常模式和可能的故障源点。这可能导致故障的误判或漏判,从而影响到故障隔离的准确性。现有的方法往往只关注于故障的识别和隔离,缺乏对整个故障处理流程的系统性和完整性考虑。例如,缺乏对故障影响的分析、恢复策略的制定等环节,这可能导致故障处理不够全面和高效。


技术实现思路

1、本专利技术提供了一种基于事件日志的自主式实时故障隔离方法,主要包括:

2、从it运维事件日志中提取异常模式并标记可能的故障源点;根据已标记的异常模式,构建一个智能过滤器,从日常日志中筛选出与故障相关的日志;使用加权有向图,将标记为异常的日志视为图中的边,系统组件视为节点,构建故障传播图;在故障传播图中,快速定位核心故障节点和其关联节点;利用图论方法,分析核心故障节点与其他节点之间的依赖关系,判断显示依赖节点与隐形依赖节点,获得整个故障网络;量化核心故障节点对服务的影响力,以确定哪些节点需要优先恢复;针对核心故障节点和关联节点,设计隔离策略,阻断与健康节点的连接,以防止故障进一步扩散;建立恢复策略并在模拟环境中进行验证,确保其可以有效地恢复故障节点而不影响其他与之有依赖关系的健康节点;对故障节点进行实际恢复,确保故障节点快速返回到正常状态,分析系统日志确保系统恢复稳定,无新的异常模式出现。

3、在一种实施方式中,所述从it运维事件日志中提取异常模式并标记可能的故障源点,包括:

4、从系统、应用程序和网络设备中获取事件日志数据,记录系统运行中发生的异常或错误,包括系统性能下降,应用程序崩溃,网络连接中断,数据丢失或损坏;对获取到的事件日志数据进行清洗和预处理,包括去除重复项、处理缺失值和异常值;根据事件日志的内容和特点,从日志中提取特征信息,包括时间戳、事件类型、错误代码、关键词,将事件日志数据转化为可用于进一步分析的结构化数据;使用长短期记忆网络,对提取到的事件日志特征进行异常模式识别,获取日志数据中的异常行为和模式;根据异常模式识别的结果,结合系统架构、网络拓扑、硬件配置,标记故障源点和影响范围;根据识别的具体故障源点和影响范围,自动调整it运维策略,和相关系统和设备的配置,减缓或防止故障扩散。

5、在一种实施方式中,所述根据已标记的异常模式,构建一个智能过滤器,从日常日志中筛选出与故障相关的日志,包括:

6、根据日志与日志中被标记的异常模式,使用朴素贝叶斯建立一个智能过滤器,对日志中的文本数据进行分类,筛选出与故障相关的日志条目;将智能过滤器的分类结果与已知的异常模式进行匹配,对这些日志条目进行分类和标记,将其归类到不同的异常类别中;对标记的日志条目进行统计分析,获取日志数据的特性,包括频率、密度;基于统计特性,采用k-means算法,将日志数据细分为不同的异常类别;将细分后的异常类别数据整理和归档,存储在数据库中供进一步的分析和处理;从数据库中提取异常类别数据,分析数据是否存在未知的故障模式或者能与已知模式关联的信息,将未知故障的特征加入智能过滤器;使用训练好的模型,实时监控含有这些异常模式的日志,进行实时数据分析,快速响应和处理潜在的系统故障。

7、在一种实施方式中,所述使用加权有向图,将标记为异常的日志视为图中的边,系统组件视为节点,构建故障传播图,包括:

8、若异常日志数量增加,对日志进行分类,每种异常类型对应特定的系统组件和故障模式;根据每种异常类型,利用加权有向图构建故障传播图,每个系统组件作为节点,异常日志作为边,边的权重由异常日志的严重性决定;通过facets将故障传播图可视化,分析系统组件间的关系和异常传播路径,图中每个节点和边都包含属性和元数据;如果异常识别准确,根据组件关系和传播路径数据,对故障传播图进行深度分析,寻找潜在的故障和异常传播模式;获取分析结果,明确异常传播模式和受影响的系统组件,根据组件的属性和元数据,判断其在故障传播中的角色;判断故障传播模式的完整性和准确性,如果不足,回到异常日志,提取更多的属性和元数据,以丰富故障传播图;根据更新后的故障传播图,重新分析受影响的系统组件和异常传播路径;对更新后的故障传播图进行训练和优化,分析优化后的故障传播图,识别关联到系统的故障和异常的关键节点和边,输出优化后的系统故障传播图。

9、在一种实施方式中,所述在故障传播图中,快速定位核心故障节点和其关联节点,包括:

10、故障传播图显示存在故障时,对故障范围内的节点进行实时监控,获取节点的状态数据和网络流量信息;将实时监控得到的异常数据输入数据分析中心,根据故障传播图的图形相关特征,训练gcn模型,使用gcn对故障传播图进行初步筛选和分析,识别存在异常的节点;根据初步分析结果中异常节点连接的节点数量,判断哪些节点是核心故障节点,若异常节点连接的节点数量高于预设节点数量,判断为核心故障节点;获取核心故障节点和关联节点的数据,通过网络拓扑信息分析节点的连接路径和数据交换,判断故障范围和影响;如果发现故障节点及关联节点间的连接路径显示异常,判断故障是否扩散;如果连接路径异常,启动自动修复机制,调整网络配置或限制数据流向来修复或隔离异常路径;对修复或隔离后的数据进行再次处理,对修复后网络状态进行监控;如果监控发现故障未彻底修复,启动预防机制,限制故障节点的数据传输或增强网络安全设置;根据预防机制的运行状况,对故障传播图进行调整,调整节点连接权重或路径优先级;还包括:根据故障传播图的图形信息训练gcn模型。

11、所述根据故障传播图的图形信息训练gcn模型,具体包括:

12、将故障传播图表示为一个由节点和边组成的网络。每个节点代表一个设备或系统,每个边代表设备或系统之间的连接关系。获取与图形相关的特征,包括节点的度、节点的邻居节点。将获取到的图形数据和特征进行预处理,包括数据清洗、标准化、归一化,将图形数据转换为可被gcn处理的邻接矩阵和特征矩阵格式。使用gcn模型对预处理后的图形数据进行训练。gcn模型对节点特征进行卷积操作,捕捉节点的局部和全局信息。在训练过程中,使用已知的异常节点作为标签来训练模型。使用训练好的gcn模型对新的故障本文档来自技高网...

【技术保护点】

1.一种基于事件日志的自主式实时故障隔离方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其中,所述从IT运维事件日志中提取异常模式并标记可能的故障源点,包括:

3.根据权利要求1所述的方法,其中,所述根据已标记的异常模式,构建一个智能过滤器,从日常日志中筛选出与故障相关的日志,包括:

4.根据权利要求1所述的方法,其中,所述使用加权有向图,将标记为异常的日志视为图中的边,系统组件视为节点,构建故障传播图,包括:

5.根据权利要求1所述的方法,其中,所述在故障传播图中,快速定位核心故障节点和其关联节点,包括:

6.根据权利要求1所述的方法,其中,所述分析核心故障节点与其他节点之间的依赖关系,判断显示依赖节点与隐形依赖节点,获得整个故障网络,包括:

7.根据权利要求1所述的方法,其中,所述量化核心故障节点对服务的影响力,以确定哪些节点需要优先恢复,包括:

8.根据权利要求1所述的方法,其中,所述针对核心故障节点和关联节点,设计隔离策略,阻断与健康节点的连接,以防止故障进一步扩散,包括:

9.根据权利要求1所述的方法,其中,所述建立恢复策略并在模拟环境中进行验证,确保其可以有效地恢复故障节点而不影响其他与之有依赖关系的健康节点,包括:

10.根据权利要求1所述的方法,其中,所述对故障节点进行实际恢复,确保故障节点快速返回到正常状态,分析系统日志确保系统恢复稳定,无新的异常模式出现,包括:

...

【技术特征摘要】

1.一种基于事件日志的自主式实时故障隔离方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其中,所述从it运维事件日志中提取异常模式并标记可能的故障源点,包括:

3.根据权利要求1所述的方法,其中,所述根据已标记的异常模式,构建一个智能过滤器,从日常日志中筛选出与故障相关的日志,包括:

4.根据权利要求1所述的方法,其中,所述使用加权有向图,将标记为异常的日志视为图中的边,系统组件视为节点,构建故障传播图,包括:

5.根据权利要求1所述的方法,其中,所述在故障传播图中,快速定位核心故障节点和其关联节点,包括:

6.根据权利要求1所述的方法,其中,所述分析核心故障节点与其他节点之间的...

【专利技术属性】
技术研发人员:李海彬叶小飞陈舒婷董剑雯钟金凤许孟昶韩锋
申请(专利权)人:福建省电子政务建设运营有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1