一种基于Bert_RNN实现系统日志自动化分类的方法技术方案

技术编号：38213177 阅读：11 留言：0更新日期：2023-07-25 11:21

本发明专利技术公开一种基于Bert_RNN实现系统日志自动化分类的方法,涉及日志检索技术领域；获取已分类的日志文件信息，利用所述日志文件信息训练Bert日志分类模型，通过Bert日志分类模型将所述日志文件信息中文本语句进行特征转换，获得特征向量，将特征向量作为Embeddings输入双向RNN循环神经网络，优化Bert日志分类模型，其中通过双向RNN循环神经网络经过前向传递层和后向传递层分别获取输入序列每一个点的上文信息和下文信息，合并上文信息和下文信息的隐藏层状态作为输出，验证并测试优化后Bert日志分类模型，利用Bert日志分类模型进行系统日志自动化分类。分类模型进行系统日志自动化分类。分类模型进行系统日志自动化分类。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Bert_RNN实现系统日志自动化分类的方法

[0001]本专利技术公开一种方法,涉及日志检索
，具体地说是一种基于Bert_RNN实现系统日志自动化分类的方法。

技术介绍

[0002]系统日志泛指运行于计算机上的软件系统所产生的相关记录信息，通常以文本文件的形式存在。系统日志包含了大量的关于系统运行、操作使用等相关情况的原始记录，如何更好的分析挖掘海量系统日志中包含的信息十分有意义，但海量日志分析是一个系统性的工程，包含了从原始数据采集到终端可视化的展示交互等一系列的环节。然而这些分类工作通常是需要工程师或用户来事先设置指定，但在实际应用中经常会出现日志类型指定错误或不知道所属类型的情况，导致需要对日志进行重新采集，或分析挖掘达不到预期的效果等问题。

技术实现思路

[0003]本专利技术针对现有技术的问题，提供一种基于Bert_RNN实现系统日志自动化分类的方法，对系统日志进行自动化分类，提高日志分类效率及分类准确性，便于系统分析挖掘日志内容。
[0004]本专利技术提出的具体方案是：
[0005]本专利技术提供一种基于Bert_RNN实现系统日志自动化分类的方法，获取已分类的日志文件信息，利用所述日志文件信息训练Bert日志分类模型，通过Bert日志分类模型将所述日志文件信息中文本语句进行特征转换，获得特征向量，
[0006]将特征向量作为Embeddings输入双向RNN循环神经网络，优化Bert日志分类模型，其中通过双向RNN循环神经网络经过前向传递层和后...

【技术保护点】

【技术特征摘要】
1.一种基于Bert_RNN实现系统日志自动化分类的方法，其特征是获取已分类的日志文件信息，利用所述日志文件信息训练Bert日志分类模型，通过Bert日志分类模型将所述日志文件信息中文本语句进行特征转换，获得特征向量，将特征向量作为Embeddings输入双向RNN循环神经网络，优化Bert日志分类模型，其中通过双向RNN循环神经网络经过前向传递层和后向传递层分别获取输入序列每一个点的上文信息和下文信息，合并上文信息和下文信息的隐藏层状态作为输出，验证并测试优化后Bert日志分类模型，利用Bert日志分类模型进行系统日志自动化分类。2.根据权利要求1所述的一种基于Bert_RNN实现系统日志自动化分类的方法，其特征是所述获取已分类的日志文件信息，利用所述日志文件信息训练Bert日志分类模型，包括：将已分类的日志文件信息在句首均添加所属类别，存于一个文档中，并按照8:1:1的比例将所有的日志文件信息分成训练集、测试集和验证集，并分别建立训练集、测试集和验证集的数据集迭代器。3.根据权利要求1所述的一种基于Bert_RNN实现系统日志自动化分类的方法，其特征是所述通过Bert日志分类模型将所述日志文件信息中文本语句进行特征转换，获得特征向量，包括：利用字向量、段向量和位置向量的总和表示特征向量。4.根据权利要求1所述的一种基于Bert_RNN实现系统日志自动化分类的方法，其特征是所述优化Bert日志分类模型，包括：利用BertAdam算法优化Bert日志分类模型，将训练分为多个epoch，每个epoch中按总的batch大小分为若干轮，在每轮训练的同时，使用验证集对Bert日志分类模型进行验证，使用函数functional.cross_entropy()和函数metrics.accuracy_score()计算损失值和准确率。5.根据权利要求4所述的一种基于Bert_RNN实现系统日志自动化分类的方法，其特征是所述使用验证集对Bert日志分类模型进行验证，包括：每轮训练结束，输出损失值和准确率；验证损失值、...

【专利技术属性】
技术研发人员：高嘉翾，
申请(专利权)人：上海沄熹科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人