基于LSTM-Transformer的日志异常检测方法及系统技术方案

技术编号：35600446 阅读：25 留言：0更新日期：2022-11-16 15:21

本发明专利技术提供了一种日志异常检测方法及系统，应用于系统的日志异常检测领域。该系统使用Drain、Word2Vec、TF

全部详细技术资料下载

【技术实现步骤摘要】
基于LSTM
‑
Transformer的日志异常检测方法及系统

[0001]本专利技术涉及计算机
，更具体说是涉及一种基于LSTM
‑
Transformer的日志异常检测方法及系统。

技术介绍

[0002]对于大规模的软件系统，特别是那些部署在云服务器上的软件系统，增强系统的健康状况和稳定性至关重要。外部故障(例如，恶意攻击、节点断开)和内部软件错误(例如，无限循环、不正确的配置)都可能传递到意外的系统中止。所有这些故障都被视为异常现象。云服务器的大规模停止可能会导致下游服务的失败，客户流失，甚至造成巨大的经济损失。日志数据是一种广泛可用的数据资源，它在各种软件系统的运行时记录系统状态和关键事件。开发人员通常利用日志数据来获取系统状态，检测异常情况，并定位根本原因。隐藏的丰富信息为分析系统问题提供了一个很好的视角。因此，通过在大量的日志数据中挖掘日志信息，日志异常检测的方法可以帮助增强系统的运行状况、稳定性和可用性。随着现代计算机系统的规模和复杂性的增加，日志数据呈爆炸式产生。处理如此大量的日志数据是一个关键的挑战。我们迫切需要一个高效的日志处理和检测异常的工具，而不是容易出错和耗时的手工工作。
[0003]对日志进行异常检测工作前需要对日志进行日志解析和特征提取等工作。日志解析已取得了很好的成绩。在本专利技术中，着重讨论特征提取和异常检测的细节。
[0004]现有的检测日志异常的特征提取方法大致可以分为两类:基于日志事件计数的方法和基于日志事件语义信息的方法

【技术保护点】

【技术特征摘要】
1.一种基于LSTM
‑
Transformer的日志异常检测方法及系统，其特征在于，步骤如下：步骤1：对原始的系统日志数据使用Drain进行解析，将半结构化日志转化为日志模板和日志组件参数等；步骤2：将解析后的日志按照生成顺序排列在一起构成日志序列向量；步骤3：将日志模板内容作为Word2Vec的输入，得到单词向量，结合日志事件序列的TF
‑
IDF，可以得到日志事件序列的特征向量；步骤4：根据组件参数序列的TF
‑
IDF，得到日志组件序列的特征向量；步骤5：将日志事件序列的特征向量矩阵与日志组件序列的特征向量矩阵进行拼接得到最终的特征向量矩阵；步骤6：得到最终的特征向量矩阵之后，LSTM
‑

【专利技术属性】
技术研发人员：李敏，孙锰杰，韩德隆，周鸣乐，刘一鸣，
申请(专利权)人：齐鲁工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人